محركات بحث الصور rer etal‏ 
على الإنترنت 


مطبوعات 
مكتبة الملك فهد الوطنية 
السلسلة الثانية 


(01) 


تعنى هذه السلسلة بنشر الدراسات والبحوث 
في إطا ر علم المكتبات والمعلومات بشكل عام 


محركات بحث الصور الثايتة على الانترنت 
دراسة تحليلية 


سيد ربيع سيد إبراهيم 


معيد بقسم GLAS‏ والوثائق 


مكتبة الملك فهد الوطنية 
مالریاض ۲۸٤۱د‏ - ۲۰۰۷ م 
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© مكتبة الملك فهد الوطتية ۱٤۲۸۰‏ هم 
فهرسة مكتبة الملك فهد الوطنية e Lii‏ النشر 


إبراهيم C‏ سيد ربيع سيد 

محركات بحث الصور الثابتة على الإنترنت / سيد ربيع 
سيد إبراهيم - الرياض ١5178:‏ د 
4٤ص‏ : VE‏ سم (الثانية : (o*‏ 


٩٩1۰-۰ -TAAA : ردمك‎ 


١‏ - محركات البحث "-الانترنت أ.العنوان ب.السلسلة 
ديوي VEYA/YYAO LAVA‏ 


VEYA/YYAO : رقم الإيداع‎ 
AAT -e * -YAA-A : ردمت‎ 


جميع حقوق الطبع محفوظة› غير مسموح بطبع أي جزء من أجزاء هذا الڪتابء 
أو اختزائه © اي نظام لاختزان المعلومات واسترجاعها c‏ أو نقله على أية هيئة أو بأية وسيلة 
سواء كانت إلكترونية أو شرائط ممغنطة او ميكانيكية:؛ أو استنساخاً » أو تسجيلاً: 
أو غيرها إلا 4 حالات الاقتباس المحدودة بفرض الدراسة مع وجوب ذكر المصدر. 


ص .ب : VOVY‏ 
الرياض : ١١400‏ -المملكة العربية السعودية 
هاتف: 41۲٤۸‏ 


٤1٤0۳٤١ : فاكس‎ 


المحتويات 


ثانيًا: تساؤلات الدراسة 
ثالنًا: أهمية الدراسة ومبرراتها 
رابعًا : أهداف الدراسة 
خامسًا : تعريفات إجرائية 
سادسًا : عينة الدراسة 
dine - [‏ محركات البحث 
\ / ب محركات بحث محددة 
ب - تماذج الكلمات البحثية 
ج - أدوات الدراسة التجريبية 
AL.‏ منهج الدراسة وأدواتها 
Gti‏ : حدود الدراسة 
تاسعًا: الدراسات المثيلة 
أ/ الدراسات السابقة للصور الثابتة 


الموضوع 


ب / قراءة في أدبيات الإنتاج الفكري للصور الرقمية 


عاشرًا محتويات الدراسة 


الباب الأول : الإطار المنهجي للدراسة 


الفصل الأول: البحث على الويب مفاهيمه وأساليبه وأنواعه 


۱ التمهيد 
١‏ الويب 
1١‏ بنية الويب ومكوناته 
١‏ البحث Jala‏ الويب 
70١‏ استخدام مسار أو عنوان موقع المعلومات 
70١‏ استخدام برامج تصفح الإنترنت 
70١‏ استخدام مجموعات الأخبار على الويب 
70١‏ بحث قواعد البيانات المعلومات غير المرئية 
70١‏ الويب غير الشفافة 


TEE ....................... الويب الخاصة‎ ١ 


70١‏ الويب ols‏ الملكية 
7١‏ الويب غير المرئية 
0١‏ تصفح أحد أدلة البحث على الويب 
70 الاتجاه إلى أحد محركات البحث 
١‏ أدوات البحث على الويب 
0١‏ كيفية عمل أدوات البحث 
0١‏ إستراتيجيات البحث في أدوات البحث 
۱ محركات البحث 
١‏ مفهوم محرك البحث 
0١‏ أنواع محركات البحث 
١‏ أنواع المحركات من حيث اللغة 
0١‏ أنواع المحركات من حيث الاسترجاع 


الصفحة 
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الموضوع 


0١‏ أنواع المحركات من حيث النطاق الجغرافي 
١‏ أنواع المحركات من حيث الموضوع 
0١‏ أنواع المحركات من حيث التخصص النوعي 
١‏ أنواع المحركات من حيث التخصص الشكلي 
/١‏ محركات بحث المادة المصورة 
0١‏ مفهوم محرك بحث المادة المصورة 
١‏ نظم إدارة واسترجاع المادة المصورة 
١‏ نظم إدارة المادة المصورة 
١‏ نظم تصفح الملفات 
0١‏ نظم البحث البسيطة 
١‏ نظم التصفح الكاملة 
0١‏ نظم إدارة المادة المصورة المخصصة 
0١‏ نظم استرجاع المادة المصورة 


TX استرجاع المادة المصورة بأسئلة البحث المباشر‎ ١ 


0١‏ الاسترجاع بالنماذج المصورة 
١‏ استدعاء المادة المصورة الرقمية بالتصفح 


E PIA نظم استرجاع المادة المصورة الرقمية المتكاملة‎ 0١ 


الفصل الثاني: المادة المصورة في البيئة الرقمية تطبيقاتها وتقنياتها 
«/Y‏ التمهيد 
7/ المادة المصورة من الكهوف إلى الويب 
Y/Y‏ تطبيقات المادة المصورة 
۲ التطبيقات العامة للمادة المصورة 
7/ التطبيقات العلمية للمادة المصورة 


ipea sarei A snae eae oot TE & ll في مجال دراسة‎ Y v/v/Y 


۲ في مجال الهندسة والتصميم المعماري 


PAE O CERE NC الإعلام‎ Slee في‎ ۲ 


الموضوع 


71 في مجال الطب 

757 في مجال القانون وعلم الجريمة 
۲ في مجال الجفرافيا والسياحة: 
7۲ في مجال التجارة : 

7 في مجال التعليم والبحث العلمي 


۲ أنواع المواد المصورة 
۱/۲/۲ المواد المصورة المتحركة 


۲ الأفلام 
۲ الرسوم الحيوية 


Y/Y/Y‏ المواد المصورة الثابتة 


۲ الرسوم التوضيحية 
۲۷ صور الأشعة 
۲ اللوحات الفنية 

۲ الرسوم الكاريكاتيرية 
۲ الشرائح 


۲ المادة المصورة في بيئة الويب 
١/8/7‏ الصو الفوتوغرافية هي Atay‏ انوب 


1/V/i/Y‏ الوصف المادي لنصور الفوتوغرافية على الويب 
7۲ التحليل الموضوعي للصور الفوتوغرافية على الويب 


۲ الصيغ المعيارية لوصف الصور الرقمية 
7/7 مهيار esca ASS ASE NISO‏ 
Y/Y/ti/Y‏ معيار SSE DIG35 Specifications‏ ل 
مهيار E VRA3‏ طن كو لس ا usd‏ 
£/Y/t/Y‏ معيار TERR Metadata for Long term Preservation‏ 
0/Y/t/Y‏ معیار دبلن كور LS ero e at Dublin core‏ 
7/7 ميار Mes RGL‏ 

۲ عناصر محورية في وصف الصور الرفمية 
o/Y‏ الخلاصة 


الموضوع الصفحة 


الفصل الثالث: alas‏ الصور ۳۳ 
٠/۳‏ التمهيد ١6‏ 
۳ الوصف المادي والموضوعي للصور الرقمية YYo‏ 
V/Y/Y‏ الوصف المادي للصور الفوتوغرافية الرقمية Yo‏ 
۲۳ خصائص التسجيلة في معيار الميتاداتا ۳۹ 

۲۳ التحليل الموضوعي للصور E‏ 
۳ البحث بالتقسيم الموضوعي 10۰ 
7۲۳ علاقة التصفح باللغة المضبوطة ١6‏ 
7۲۷ مشكلات التصفح في استرجاع الصور الرقمية Yor‏ 

YoV الحر بالكلمات المفتاحية‎ cual Y/Y/Y/Y 

1 الوصف الموضوعي بالواصفات المنفردة \ov‏ 
۳ الوصف الموضوعي بالعبارات ...... t nd‏ و و NU‏ 
۲١‏ الوصف الموضوعي بالجمل المترابطة 11۲ 

310 معالجة اللغة العربية في نظام استرجاع الصور‎ Y/Y 
110 مشكلات البحث الحر باللفة العربية في البيئة الرقمية‎ Y/Y/Y 
١ 6 الاسترجاع اللفظي‎ 7۳ 
110 صيفغة الفعل‎ //“* 

۳ الإملاء ورسم الكلمات 110 

VU الاسترجاع بالمعنى‎ ۳ 
VLE e OT DOS S المترادفات‎ ۲۳ 

۳ الاشتراك اللفظي any Oa‏ ا SR‏ ا 

VTA والثقافة‎ aal Y/1/Y/Y 

۳ آليات التعامل مع اللفة العربية في البيئة الرقمية 31A‏ 
۳ آليات البحث بالكلمة الواحدة 31A‏ 
۲۳ البحث بالتطابق Y14‏ 
۲ البحث غير المطابق البحث باللواصق" ۱۹ 
٣‏ البحث بجذر الكلمة حل alia‏ الاشتقاق 1۷۰ 
eui £/Y/Y/Y/Y‏ بالتشكيل لكلمات المشترك اللفظي MVS ae‏ 
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الموضوع 


۳ البحث بالمقاطع (أجزاء الكلمة) 

7/6 البحث بحساسية Alla!‏ 

۲۳ البحث بالمترادفات 

۳ البحث بالمتضادات 

7۳ البحث بالمعاني 

//Y/Y/Y‏ التعرف إلى الأخطاء العربية الشائعة 
۳ أليات البحث بكلمات متعددة 


۳ البحث في الحقول .. Re TE‏ 


۲١‏ صياغة الجملة البحثية 
۲ استخدام علامات التطابق 
 / ۳‏ البحث المعقد أو Spall‏ 
Y/Y/Y/Y‏ أساليب بحث أخرى متطورة 
۳ البحث بصيفة توسيع السؤال 
۲۳ البحث بوزن الكلمة 
taAa! r/r‏ 


الباب الثاني : تحليل البيانات وعرضها 
الفصل الرايع: محركات بحث الصور 
4/ تمهيد 
4 آليات البحث في محركات الصور 
//٤‏ آليات البحث العامة 
٤‏ آليات البحث بالتصفح 
4 آليات البحث بالكلمات المفتاحية 
Lil ¥/1/t‏ البحث النوعية 
4+ البحث بالتفطية الزمنية والمكانية لوحدات الصور 
٤‏ البحث بالمسار أو العنوان 
7+4 البحث باستخدام حقول الوصف الببليوجرافي 


WY sarn - 


الموضوع — 


4/ خصائص محركات بحث !]2942 
Y/Y/t‏ الوصف الببليوجرافي للصورة 


"REED Ub :اه شخي ا‎ eaa call مستويات‎ Y/Y/t 


4+ لفات الوصف المستخدمة في التكشيف 
/٤‏ واجهات محركات بحث الصور 
٤4‏ طرق عرض النتائج ومكوناتها 
4 طرق عرض النتائج من الصور 
4 أنواع البيانات المصاحبة لعرض النتائج 
74 سمات عرض الصور 
4 خدمات محركات بحث الصور 
٤4‏ رسائل المتابعة أثناء البحث 
٠٤‏ ترشيح الصور وفق سمات المستفيد 
+ مرشحات الصور (الفلاتر) 
غ/؟/:؛ كثافة الصور 
4 كفاية استرجاع محركات بحث الصور 
1/£/t‏ محركات البحث المحددة 
٤‏ محركات بحث الويب 


1 الخلاصة 


الفصل الخامس: مرشحات الصور 
٠/٥‏ التمهيد 
٥‏ مفاهيم الترشيح 


06 ترشيح المعلومات مل حي To‏ سق بان و oO dabat etg‏ 


6 المرشحات أو برامج الترشيح 
Y/0‏ ترشيح المعلومات المصورة 

٥‏ ترشيح المعلومات على الويب 

0 آلية ترشيح المعلومات المصورة 


a VY کے‎ 


YYY أنماط ترشيح المعلومات المصورة‎ Y/o 
۳٤ الترشيح داخل مصادر المعلومات‎ 6 

0 الترشيح داخل البريد الإلكتروني YYt‏ 
۵٥‏ الترشيح داخل محركات البحث Yo‏ 

0 تسيير الترشيح داخل محركات البحث YY4‏ 
706 إضافة وترشيح المحتوى ۳4 
0 تنفيذ استفسارات البحث Yé.‏ 

yé. أنواع المرشحات داخل محركات البحث‎ ٥ 
Yoo مرشح معلومات العميل‎ 06 
T£ مرشح معلومات مزودي الإنترنت‎ 00 
55١ مرشح مملومات خادمات الويب‎ 0 
5١ مرشح معلومات محركات البحث‎ 0 
Yé) ترشيح الصور الرقمية‎ 0/0 
Vey الترشيح النصي‎ ٥ 
yéy إيقاف الكلمات الدالة‎ 0 

76 إيقاف المجموعات الموضوعية Y€‏ 
70 إيقاف محدد المصادر yey‏ 

6 الترشيح التحليلي YE‏ 
٥٠‏ ترشيح الصور داخل محركات بحث الصور EV‏ 
٠٥‏ مرشحات الصور داخل محركات البحث d on CDE SOD E A‏ 
0 تفعيل مرشحات الصور Yo‏ 

5 العلاقة بين مرشح الصور ومستخدم الصور الرقمية YoY‏ 

0 نمط الترشيح المتيع داخل مرشح الصور YoY‏ 
0 مرشح الصور بين مراحل عمل محرك الصور Yog‏ 

06 فاعلية مرشحات الصور داخل محركات البحث Yoo‏ 
٥‏ العلاقة بين الترشيح ومعاملات نظم الاسترجاع Yor‏ 
0 أولا: في مرحلة الإضافة والتنظيم : You‏ 

0 ثانيًا: في مرحلة البحث : Yov‏ 


الموضوع الصفحة 


706 ترشيح النتائج Yov‏ 
0/0 ترشيح إستراتيجية البحث YOA‏ 
0 الخاتمة YOA‏ 


الفصل السادس: مواصفات محرك بحث 15920 يدعم اللغة العربية YA‏ 


مواصفات محرك بحث صورًا يدعم اللفة العربية yr‏ 
5 التمهيد yy‏ 
5 مراحل تكشيف الصور الرقمية yur‏ 
57 / تحليل ملف الصورة إلى polie‏ محددة 10 
771 تحويل العناصر إلى حقول ببليوجرافية Yay‏ 
css Y/13/3/1‏ التسجيلة الببليوجرافية Yay‏ 

57 اختيار الكلمات المفتاحية في ملف الصورة (التكشيض) 5848 
57 مستويات التكشيف للصور الرفمية VY‏ 
7 إجراءات تكشيف ملفات وصفحات صورًا الويب VE‏ 
757 لفات التعبير عن المحتوى والموضوع ...................... ٣۷۷‏ 

57 الاعتماد على معجم آلي AAU‏ العربية YVA‏ 

Y^* تكوين قواعد بيانات محرك البحث الداخلية‎ 1٦1 

7 إعداد واجهة صفحة التسجيلة النهائية EAN DSS RE‏ 
7 ككل التسجيلة النهائية YAY‏ 
7 أنواع الخدمات المقدمة تجاه التعامل مع الصورة YAY‏ 

5 مراحل عمل محرك الصور YAY‏ 
7 مرحلة عمل برنامج الزاحف أو العنكبوت YAY‏ 
1 خصائص البحث والتحديث YAÉ‏ 
5 قائمة توقف عن الصور YAY‏ 
Ru Y/V/Y/A‏ صفحات الويب YAV‏ 

7 مموقات وحلول عمل برنامج الزاحف YAV‏ 

7 مرحلة البحث في المحركات ۲۸۹ 
7 استخدام أسلوب التصفح Ys‏ 


الموضوع l‏ الصفحة 


7 استخدام البحث بالكلمات المفتاحية yar‏ 
7 استخدام آليات بحث اللفة العربية Y4o‏ 

7 الترجيح بين النتائج الترتيب بحسب الصلة 4۹۷ 
۲/۹ مراحل عرض النتائج Y44‏ 
57 واجهة محرك بحث الصور 4۹ 
1 شكل آليات البحث Yee‏ 
1 عدد واجهات البحث Tus‏ 


1 تقسيمات واجهة البحث 


١ 

7 واجهة نتائج محرك بحث الصور Yey‏ 
1 شكل الصور المعروضة pup‏ 
51 البيانات الببليوجرافية المصاحبة Yey‏ 
5 عدد الصور المعروضة Yey‏ 

yey ملامح احتياجات المستفيدين في محرك البحث‎ 5 
TAG LN O ine etate da a MEER الخلاصة‎ 5 
TB نتائج الدراسة‎ 
TAT ea beats e ale SSR التوصيات كنع كي نندت دل فد‎ 
Yo المراجع‎ 
YYo الملااحق‎ 

يت & ليت 


الجداول 


الجدول رقم )١-١(‏ : 
الجدول رقم )5-١(‏ : 
الجدول رقم )١-5(‏ : 
الجدول رقم (Y-Y)‏ : 
الجدول رقم (Y-Y)‏ : 
الجدول رقم (£7Y)‏ : 
الجدول رقم (YT)‏ 
الجدول رقم (Y-Y)‏ : 
الجدول رقم (Y7Y)‏ : 
الجدول رقم (£7Y)‏ : 
الجدول رقم )07( : 
الجدول رقم (VY)‏ : 
الجدول رقم )١-4(‏ : 
الجدول رقم (Y7£)‏ : 
الجدول رقم :(Y7£)‏ 
الجدول رقم (4-4) : 
الجدول رقم )07£( : 


الجدول رقم (7E)‏ : 


قائمة الجداول 


الصفحة 
أنواع برتوكولات الإنترنت e OA HERR‏ 
أنواع صفحات الويب oY‏ 
عناصر جامعة تكساس لوصف الصورة الرقمية BR‏ 
مراتب استخدام معابير الوصف الببليوجرافي داخل المكتبات YE‏ 
حقول الميتاداتا لوصف ملفات الصور الرقمية \YA‏ 
حقول الميتاداتا لوصف ملفات الصور الرقمية للمصادر العربية .. ٠١۹‏ 
عناصر التسجيلة الإنجليزية للصور الرقمية في المستوى الأول ٠١۷‏ 
التسجيلة الإنجليزية للصور الرفمية في المستوى الثاني YA‏ 
عناصر التسجيلة العربية للصور الرقمية في المستوى الأول NYA ieee‏ 
عناصر التسجيلة العربية لوصف الصورة المستوى الثاني VTA d‏ 
التسجيلة الكاملة الأجنبية للصورة الرقمية العامة في بيئة الويب  ١51١‏ 
التسجيلة الكاملة العربية للصورة الرقمية العامة في اللفة العربية  ١57”‏ 
أساليب استرجاع المعلومات لمحركات بحث الويب مسقن مو يي WANS‏ 
آليات البحث المستخدمة في عينة محركات البحث كما 
آليات بحث اللغة العربية في محركات بحث الصور IET‏ 
حقول الوصف الببليوجرافي التابعة لتسجيلات الصور الرقمية 14۹۷ 
مصادر تكشيف الصور داخل محركات البحث Y*Y‏ 
لفات التعبير عن المحتوى الموضوعي للصور لمحركات البحث ... ۲١٠١۵‏ 
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الجداول 


الجدول رقم (V7£)‏ : 
الجدول رقم (A7£)‏ : 
الجدول رقم (A-t)‏ : 
الجدول رقم )٠١-4(‏ : 
الجدول رقم )١١-4(‏ : 
الجدول رقم (17-4) : 
الجدول رقم )١15-4(‏ : 
الجدول رقم )170( : 
الجدول رقم (Y70)‏ : 
الجدول رقم )0 (T‏ : 
الجدول رقم )£70( : 
الجدول رقم )0-0( : 


الجدول رقم (5- )١‏ : 


عيئة البحث مع عناصر واجهات البحث 


VUE AR gh eee a qm جوائب واجهات محركات بحث الصور‎ 


طرق عرض نتائج وحدات الصور الرفمية 
البيانات والحقول المناسبة لعرض نتائج الصور 
سمات عرض الصور 
معاملات فياس الكفاية نموذج للانكستر 
المعاملات المقترحة لقياس كفاية المحركات الصور 
مرشحات الصور داخل محركات بحث العينة 
العلاقة بين مرشح الصور ومستخدم الصور 
تقنية الترشيح داحل مرشح الصور 
مرحلة الترشيح بين مراحل عمل محرك البحث 
مستوى فاعلية مرشحات الصور 


نهايات العمل لبرنامج الزاحف 


0 0 $. 
که‎ ow wu 
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عمل برنامج المحكشف 2 محرك البحث 
أنواع محركات بحث الويب 

مكان الصور الفوتوغرافية الرقمية بين أنواع المواد المرئية 

نتائج التحقيق للون بمفرده والنص بمفرده واللون والنص معا 

نموذجا تكشيف الصور الرقمية الطبيعية 

تصنيف الصور المبني على التكشيف الدلالي للمجموعات 

لقطات نتائج محركات dal‏ 

التفاعل بين سمات المستفيد وبحث مصادر الويب 2 ترشيح المعلومات 
ألية عمل الترشيح داخل محركات بحث الويب 

يوضح الترشيح المبني على القيمة داخل محرك البحث 

لبناء التفاعل بين ملامح البحث وملامح مصادر الويب 

لمراحل الترشيح المبني على المحتوى للصور الرقمية 

بنية ترشيح الصور داخل محركات البحث 

مرحلة مقترحة لعمل مرشح الصور 4 ترشيح نتائج البحث 

مرحلة مقترحة لعمل مرشح الصور ‏ ترشيح كلمات البحث 

مراحل عمل محرك بحث الصور الرقمية 

المراحل المقترحة لتكشيف الصور 

مراحل عمل محرك البحث المقترح 

مراحل التعامل بين الزاحف وصفحات ملفات الصور 
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المقدمة 


في ظل عالم تتزاحم فيه أشكال أوعية المعلومات ما بين 
مخطوط ومطبوع» ومواد سمعية وبصرية:؛ إلى وسائط 
متعددة وشبكات معلومات» تمثل الصورة المرئية الثابتة 
والمتحركة مصدرًا Lage‏ من مصادر المعلومات الأولية 
بحوار المادة النصية والمادة الصوتية. 

وتعد الصور ذات أهمية كبرى سواء للأغراض 
التعليمية أو البحثية أو أغراض عرض المعلومات لفئة 
خاصة من المستفيدين مثل المعافين سمعياء كما تخدم 
الصور الصحفيين في التعبير عن الأحداث. ويحتاج إليها 
أيضًا في المجالات العلمية مثل: الطب والكيمياء والفلك 
والنبات والحيوان والطبيعة وغيرها. ونظرًا لما تتضمنه 
الصورة من خصائص بشكلها المرئي. فهي أكثر تأثيرًا في 
داخل المتلقي حيث تغني صورة لحدث ما عن وصفه في 
ألف كلمة. وهو الأمر الذي جعل الصور تمثل أداة تعليم 
أساسية في رياض الأطفال. كما أن مناهج التعليم المهني 
تعتمد Les)‏ على الكتب والموسوعات التي تجعل مادتها 
المصورة هي الأصل والنص مساعدًا لها. ومن ذلك كتب 
الطهي والتطريز والصيانة... وغيرها. 

وتعد الصور أكثر أشكال أوعية المعلومات ندرة في 
مؤسسات المعلومات. واتبع هذه الندرة قلة الاهتمام بطرح 
مواصفات اختزان واسترجاع ووصف الصور بما يتناسب مع 
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خواص الصورة كوعاء له أهميته في عرض المعلومات المرئية. ولا يوجد من قواعد 
الفهرسة الأنجلو أمريكية AACR2‏ ما يصف التسجيلات المرئية؛ إلا ما اختص 
بالفهرس البطاقي دون الفهرس الآلي. كما غاب عن التقعيد وصف أساليب 
استرجاع الصور في قواعد البيانات الآلية. وهو ما لا يتناسب مع العدد الذي توجد 
به قواعد بيانات الصور العامة والعلمية المتخصصة. 


وتختلف الصورة عن النص في الشكل الورقي من حيث أساليب التنظيم عن 
النص في مناهج التكشيف واستخدام الواصفات» حيث يتم تحليل الصورة وفق 
موضوعها أو السياق الذي وردت فيه. ويتحدد في ذلك مستويات التكشيف المختلفة 
سواء العناصر الأساسية البارزة في الصورة أو الخلفية أو الصورة الذهنية التي 
تتشكل في ذهن المشاهد خارج إطار العناصر الموضوعية لها. وهي كلها مشكلات 
تمثل عائقا كبيرًا في استرجاع الصور بخلاف النص الذي تح.ده الكلمات. أما في 
الاسترجاع الآلي فتتضافر عناصر أخرى تجعل أمر التكشيف على مستوى النص أو 
الصورة أكثر صعوبة. فالاسترجاع الآلي يعتمد على عدد من الآليات مثل المنطق 
البوليني والبتر الضمني يتحدد وفق خصائص اللغة المستخدمة. 


يضاف إلى ما سبق أن الاسترجاع الآلي للنص يعتمد على الموضوع فقط 
وهو ما تعكسه مفردات اللغة المستخدمة. أما في الصور فإن الاسترجاع يتم وفق 
الخصائص المادية المصاحبة للصورة أيضا والتي تتمثل في اللون والشكل 
والتركيب. وهو ما يتطلب تحليل الصور بناء على الخصائص المادية لها بالإضافة 
إلى الموضوعية وصياغة تسجيلة معيارية تجمع بين واصفات التحليل الموضوعي 
وواصفات التحليل المادي للصورة. هذا إلى جانب الآليات التي يعمل بها محرك 
بحث الويب تتمثل في برامج الاختيار والتنظيم والبحث تناسب أكثر واقع تنظيم 
واستدعاء المصادر النصية التي ينتهي امتدادها على الويب إلى HTM‏ و .HTML‏ ممأ 
يعكس أن التعامل مع ملفات الصور الرقمية إنما ينبني فقط على النص المصاحب 
وهو ما يتفاوت في أحيان كثيرة بين الكلمات المكونة لاسم ملف الصور إلى بضع 
جمل واصفة لتحليل الخصائص المادية والموضوعية إلى الصورة. وهو المستوى 
الأكثر غيابًا عن بناء ملفات الصور. 
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Yi‏ : مشكلة الدراسة 


تذخر الإنترنت بالكثير من أنواع ملفات المعلومات الصورة. وأهم هذه 
الأنواع هو ملف الصور الرقميةء وتنبع مشكلة الدراسة من الكم الهائل الذي تتواجد 
به هذه الملفات على الإنترنت حتى وصلت إلى ملايين الصور الرفمية الثابتة على 
الإنترنت. وتواجه هذه الدراسة جوانب عدة تتعلق بمشكلة تنظيم واسترجاع ملفات 
الصور الرقمية على الإنترنت وأول هذه الجوانب هو عدم وجود معيار موحد 
مستخدم لتنظيم ومعالجة الصور الرقمية المعالجة الفنية على الإنترنت ؛ حيث 
يستخدم لوصف الصور الرقمية الكثير من عناصر وحقول الوصف الفني المتوافقة 
مع طبيعة الموقع أو الهيئة التي تستخدم مجموعات الصور الرقمية. وهذه الحقول لا 
تكفي للدرجة التي تحقق أعلى مستوى للاسترجاع من الصور الرقمية إلى جانب 
انخفاض مستوى التحقيق في نتائج الصور الرقمية المسترجعة على الإنترنت. 


أما الجانب الثاني محركات البحث المتخصصة في بحث الصور الرقمية 
إلى أسلوب يتناسب مع إضافة وتنظيم وبحث ملفات الصور الرقمية ؛ حيث تتعامل 
محركات البحث مع هذه الملفات كفيرها من الملفات النصية معتمدة في تنظيم 
واسترجاع الصور الرقمية على النص المرافق للصورة دون المحتوى الموضوعي أو 
حقول المعالجة الفنية للصور الرقمية كوسيط لحمل المعلومات له خصائصه 
المختلفة كلية عن وسيط النص. 


ويتعلق الجانب الثالث من مشكلة الدراسة بخصائص الصورة في حمل 
المعلومات كعناصر الوصف والتحليل الموضوعي الخاصة بها بما تحمله الصورة من 
أبعاد 2395 تختلف في عرض الموضوع وأعمقها هو البعد الثالث في محتوى الصورة 
الذي يرتبط بالمعنى المراد إيصاله من خلال عناصر الصورة Was 4G ual‏ عن 
جوانب حقوق النشر وترشيح مجموعات الصور الرقمية التي تتميز به دون غيرها 
من وسائط المعلومات النصية على الإنترنت. 


أما الجانب الرابع فيتعلق بواقع معالجة ملفات الصور الرقمية بشكل خاص 
في البيئة الرقمية العربية التي تفتقر إلى وجود paslas‏ موحدة لوصف ومعالجة 
الصور الركمية الثابتةء خاصة ووسائط حمل المعلومات المصورة عامة. 
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إن تكامل الجوانب السابقة لمشكلة الدراسة يوضح أن مشكلة الدراسة تتركز 


في البحث عن إيجاد معيار موحد يحمل حقول الوصف الملائمة للمعالجة الفنية 
للصور الرقمية على الويب» مع وضع مواصفات تفيد محركات بحث الصور في 
العمل بكفاية أقدر على تحقيق نسب الاسترجاع والتحقيق المرجوة من قبل 
المستفيدين: إلى جانب دراسة خصائص اللغة العربية للتعامل مع ملفات الصور 
الرقمية بما يفيد الباحث العربي؛ إضافة إلى إمكانية تكوين مجموعات الصور 
الرقمية العربية التي تتوافق في خصائص تنظيمها وبحثها مع خصائص aUl‏ 
العربية. 


ثانيًا: تساؤلات الدراسة 
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يمكن صياغة وتحديد مشكلة الدراسة السابقة في الأسئلة التالية:- 
ما التطور التاريخي لتناول الصور الرقمية في أدبيات الإنتاج الفكري وواقع 
المعالجة الفنية داخل مؤسسات المعلومات؟ 
ما ملامح خصائص ملفات الصورة الرقمية مقارنة مع خصائص الصورة 
الورقية؟ 
ما خصائص الصورة وطبيعتها كوسيط معلومات مرئي مقارنة بالنص؟ 
ما أهم ملامح المعابير العالمية لتكشيف واسترجاع الصور الرقمية الثابتة؟ 
كيف يمكن دعم آليات عمل محركات البحث المتخصصة بما يوافق بنية 
ملفات الصور الرقمية على الإنترنت؟ 
ما مدى تأثير مرشحات محركات بحث الصور على نتائج البحث؟ 
ما ملامح عمل مرشحات الصور الرفمية في البيئة العربية الإسلامية؟ 
ما خصائص اللغة العربية في تكشيف الصور الثابتة واسترجاعها؟ 
ما مدى كفاية محركات الصور الثابتة المعربة للتعامل مع خصائص اللغة 
العربية؟ 
ما مواصفات عمل محركات بحث الصور الثابتة التي تدعم اللغة العربية؟ 
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ÉN‏ أهمية الدراسة ومبرراتها 


.١‏ الاتجاه القوي داخل المكتبات ومرافق المعلومات نحو التعامل مع البيئة 
الإلكترونية وأوعية المعلومات الإلكترونية. ويتزايد هذا الاتجاه مع الأوعية 
الأكثر عرضة للتلف مع كثرة تداولها Jia‏ الصور والخرائط والمخطوطات 
والكتب النادرة. 


Y‏ تزايد أهمية الصور في كافة الميادين البحثية والتعليمية والإعلامية مع تقدم 
التقنيات المصاحية لها؛ حيث اصبحت هناك صور ميكروسكوبية؛. وصور Aad!‏ 
وصور بالأقمار الصناعية مع تعدد أشكال كل منهاء بالإضافة إلى تراجع النص 
أمام الصور بسبب التضخم الهائل في الإنتاج الفكري وقلة وقت الباحث 
والقارى. 

Y‏ تصاعد أهمية محركات البحث في ظل التزايد المطرد لاستخدام الإنترنت 
وتزايد المادة المتاحة من خلالهاء وتعدد وتباين الدراسات التقييمية لمحركات 
البحث من منظور كفاية لاسترجاع النص. دون التطرق لكفاية استرجاع المادة 
المصورة أو الصوتية. 

.٤‏ ندرة الدراسات التي اتجهت نحو التقعيد والتوصيف للمعالجة الموضوعية 
للصور وخاصة الصور الرفمية. حيث اتجهت معظم الدراسات إلى التركيز 
على الاسترجاع على اساس المعالجة المادية. وانحصرت المعالجة الموضوعية 
في دراسة أنماط أسئلة وطلبات المستفيدين. 


4. عدم وجود مواصفات معيارية تخدم تكشيف الصور لأغراض البحث باللفة 
العربية على كلا المستويين الورقي والرقمي. كما أن محركات البحث العربية 
لا تدعم البحث في الصور أصلا. أما المحركات غير العربية فإنها تتعامل مع 
استرجاع الصور بالنص العربي من خلال آليات تعريب تفتقر إلى الدقة 
والكفاية والمعيارية. 
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رابعًا : أهداف الدراسة 


إلى تحقيق الأهداف التالية:- 


.١ 


التعرف إلى الإنتاج الفكري المنشور في مجال استرجاع الصور الرقمية 
الثابتة. 

التعرف إلى خصائص الصورة الرفمية مقارنة مع خصائص الصورة الورقية. 

التعرف إلى خصائص الصورة وطبيعتها كوعاء معلومات مرئي مقارنة بالنص. 
تحديد معابير واصفات تكشيف واسترجاع الصور الرفمية الثابتة. 

حصر وتقييم SLIT‏ عمل محركات البحث المتخصصة في الصور الثابتة. 


قياس مدى كفاية محركات بحث الصور ذات مرشحات الويب أو بدونها على 


دراسة خصائص Gall‏ العربية في تكشيف الصور الثابتة واسترجاعها. 
العربية. 


خامسًا : تعريفات إجرائية 


محرك بحث: 
هو عبارة عن برنامج متكامل لتنظيم وبحث مصادر الويب. من خلال العمل 
بثلاثة برامج فرعية هي الزاحف لاقتناء صفحات الويب. والمكشف لتنظيم 
وتكشيف صفحات الويبء واليات البحث لدعم استرجاع صفحات الويب بحسب 
الحاجة الموضوعية للمستفيدين. 

المادة المصورة: 

يحوي مصطلح المادة المصورة كل مصادر معلومات الويب المرئية التي تعتمد 
على وسيط الرؤية لنقل المعلومات إلى المستفيد. ويستخدم هذا المصطلح 
داخل الدراسة ليشمل المواد المرئية المتحركة وغير المتحركة. 
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m‏ الصور الثابتة: 
هي مصدر المعلومات المرئي الثابت المكون من عناصر مرئية أو شكلية 
متكاملة. سواء كان شكلاً تصويريًا أو صورة فوتوغرافية أو رسومًا 
جغرافية...الخ. ويقصد به في الدراسة الصور الفوتوغرافية الرقمية. 


سادسا : عينة الدراسة 

eina البح العام اليكل في‎ teca asas الدراسة تفخ‎ catal 
محركات البحث على الويب ومجتمع الصور الرقمية على الويب. ثم اختيار عينة‎ 
ممثلة لهذا المجتمع؛ وكانت عينة الدراسة كالتالي:‎ 


Anc s"‏ محركات البحث: 
اعتمدت الدراسة على عينة قصدية من محركات البحث التي تيحث في الصور 
الثابتة سواء تلك المتخصصة في حفظ واسترجاع الصور الرقمية أو التي 
تجعل من بحث الصور اختيارًا إضافيًا في بحث مصادر الويب. وتم اختيار 
العينة بالاستعانة بالدراسات الإحصائية المتاحة على الإنترنت لقياس كفاية 
محركات البحث» وتم اختيار محركات البحث التي تحقق نسبة أعلى من 0٠‏ 
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وقد انقسمت أنواع محركات البحث في عينة الدراسة إلى نوعين هما:- 


محركات بحث الويب 
ويختص هذا النوع بالتركيز على بحث الصور الرقمية الثابتة دون غيرها 
من مصادر الويب. 


http://www.search-engine-index.co.uk/ (*) 
http://www.sarchenginespy.co.uk/update/pages/national/htm (Y) 
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Alltheweb "Fast" 
Altavista 

Ditto 
Google 
Picsearch 
Visoo 


http://multimedia.alltheweb.com 
http://www.altavista.com/image/default?qbmode= 
http://www.ditto.com 
http://images.google.com 
http://www.picsearch.com 
http://www.visoo.com/ 


محركات بحث محددة 


ويختص هذا النوع بالمحركات التي تمثل فواعد معلومات صور ثابتة. 


http://www.corbis.com Corbis 


http://www.freefoto.com Freefoto 


m‏ نماذج الكلمات البحثية 


اعتمدت الدراسة على العينة التالية من كلمات البحث لتحليل خصاتص محركات البحث:- 


Egypt and pyramids‏ | آليات seat!‏ معاملات المنطق البولينى 
And, or, not Egypt or pyramids‏ 
Egypt not pyramids‏ 
EARTH‏ | آليات البحث حساسية الحالة أو الحروف 
Earth‏ 
plane + sky‏ آليات البحث بدائل المنطق البولينى 
plane - sky‏ 
"sea beach"‏ | آليات البحث التطابق 
Egypt » 1995‏ آليات البحث التفطية الزمنية 
Egypt « 1995‏ 


Egypt near3 pyramids‏ | آليات البح البحث بحالة الكلمات 


Egypt adj pyramids 
آليات البحث البحث الحر‎ Egy?t 
Egypt* 
مستويات التكشيف الخلفية والبعد الثالث فى الصورة‎ | Sky 
Planet sky 
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الأهرام مصر آليات البحث معاملات المنطق البوليني 
And, or, not :‏ 
الأهرام 
مصر 
le Lu‏ البحر آليات البحث التطابق 
| 
القمر» قمر آليات البحث اللواصق 
سيارة آليات البحث الشوشرة (كفاية الاسترجاع) 
طائرة آليات البحث | الشوشرة ALS)‏ الاسترجاع) 
l‏ قطر آليات البحث الشوشرة ALES)‏ الاسترجاع) 


m‏ أدوات الدراسة التجريبية 
اعتمد الباحث في التعامل مع قياس كفاية محركات بحث الصور في 
خصائص البحث والاسترجاع على مجموعة ثابتة من التجهيزات. واستخدمت هذه 
التجهيزات بشكل ثابت أثناء التعامل مع كل محركات عينة الدراسة وهي كالتالي :- 
.١‏ جهاز حاسب آلي بإمكانات هي : 
gilas 8‏ نوع 4م"1200 "MGH‏ 
8 لوحة أساسية Main Board FIC‏ 
8 كارت kb 56 fax modem‏ — شاشة viewer‏ "15 
.Y‏ خط هاتف بخاصية dial up connection‏ 
وقد عمل الباحث على حساب النتائج باستخدام الأرقام المسترجعة للبحث. 
تقدير الاختلافات بين أعداد النتائج المسترجعة من قواعد بيانات محركات البحث. 
سابعًا: منهج الدراسة وأدواتها 
اعتمدت الدراسة على استخدام عدد من المناهج منها : 
m‏ المنهج الوصفي الذي يعتمد على تتبع الإنتاج الفكري وتحليل نتائج الدراسات 
الخاصة في مجال تكشيف الصورة 
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المنهج التجريبي في استخدام نماذج مختلفة من الواصفات مع محركات 
الصور وجمع نتائج الاسترجاع وتحليلهاء ثم قياس مدى auela‏ هذه النتائج مع 
أساليب الاسترجاع الآلي المطروحة للصور الرقمية ALEN‏ وخصائص اللغة 
العربية ووضع معابير ومواصفات لمحركات بحث تدعم اللغة العربية. 
المنهج المقارن الذي يعتمد على المقارنة بين كفاية محركات البحث في 
الاستدعاء والاسترجاع. 

أما أدوات جمع البيانات فتتمثل في 
أداة البحث الوثائقي لجمع الجانب النظري من الدراسة التي تتعلق ببناء 
الويب وعمل محركات البحث في جمع المصادرء إلى ما يتعلق بملفات الصور 
الرفمية وخصائصها. 
أداة المعايشة مع الإنترنت من خلال مشاهدة ومراقبة أساليب البحث 
والاسترجاع في محركات البحث وتقييم عمل هذه الأساليب والنتائج التي 
ستخرج منها مصطلحات البحث . 


ثامتا : حدود الدراسة 


الحدود الموضوعية: 

تقتصر الدراسة على موضوع محركات البحث على الويب» المحددة التي تبحث 
في الصور ذات الصبغة العامة على الإنترنت دون التعرض لمحركات البحث 
الإعلامية الخاصة بوكالات الأنياء أو بمكتبات الصور الرقمية العلمية والأدلة 
ذات التخصص الدقيق التى تبحث فى الصور العلمية أو التاريخية أو 
الجغرافية. l l‏ 

الحدود النوعية: 

تقتصر الدراسة على الصور AGL‏ ولا يدخل في ذلك أي من الصور 
المتحركة المتمثلة في لقطات الفيديو أو الرسوم المتحركة. 

الحدود الشكلية: 

تقتصر الدراسة على الصور الرفمية الفوتوغرافية بشكل خاص. ولا يدخل في 
ذلك أي من أنواع المادة المصورة الأخرى مثل الخرائط. أو الرسوم 
الكاريكاتيرية. أو اللوحات الفنية أو غيرها من الأشكال. 
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m‏ الحدود اللغوية: 
تقتصر الدراسة على محركات بحث الصور التي تدعم اللفتين الإنجليزية 
والعربية فقط دون التعرض لمحركات البحث التي تبحث في اللغات الأخرى. 

B‏ الحدود الزمنية 
تقتصر الدراسة على محركات البحث المتاحة على الويب حتى نهاية شهر 
أبريل ۲۰۰۵م 


تاسعا : الدراسات المثيلة 
1 = دراسات سابقة للصور الثابتة:- 


عمل الباحث على مسح مصادر المعلومات التقليدية والرقمية التي تتعلق 
بتنظيم وبحث المادة المصورة الرقمية في بيئة محركات البحث. وقد أثرت الخلفية 
التاريخية للإنتاج الفكري الذي بدأ فقط في النصف الثاني من عقد التسعينات على 
قلة توافر المصادر التقليدية في هذا الموضوع. وكان السواد الآعظم من مصادر 
المعلومات في الشكل الرقمي salute:‏ الوت . وافتصرت هذه المصادر على مقالات 
الدوريات xis‏ الويب والأوراق البحثية المقدمة في مؤتمرات منافشة تنظيم مصادر 
الويب. وأيضا المعلومات الإلكترونية في هيئات تنظيم الويب والصور الرقمية, 
والدراسات الأكاديمية النادرة التي تتعلق بتنظيم معلومات الصور. 


كما تبين ندرة بعض فواعد البيانات المتخصصة في ذلك مثل: 
.Dissertation Abstracts International UMI‏ إلا أن عمليات بحث هذه القواعد قد أشارت 
إلى ندرة الاهتمام بتنظيم الصورة كوعاء للمعلومات. في حين اهتم معظمها Las‏ 
يتعلق بالصور الرقمية والتخزين على الحاسبات الآلية وما يتعلق بها من تقنيات مثل 
cum ‘Content Based Image Retrieval‏ استخدام الالوان والشكل لحفظ وتنظيم الصورة 
الرقمية بعيدًا عن مفاهيم التكشيف أو المعالجة الفنية للمعلومات. ومن الدراسات 
ذات العلاقة في الإنتاج الفكري الأجنبي ما يلي:- 


الدراسة الأولى: 


Jorgensen Corinne. Image Attributes: An Investigation, Syracuse University, 
1995.- 323p.- Ph.D. 


وتتناول هذه الدراسة أدبيات ale‏ النفس ley‏ الجمال aleg‏ تكشيف الصور. 
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وعلم النفس المعرفي كعلوم أساسية تساهم في وصف نماذج الاستخدام المختلفة 
للمادة المصورة. وفد تم تحليل عناصر۷؛ صورة بشكل إحصائي من خلال تفسير 
نتائج المشاركين في التعامل مع الصور من منظور الوصف. والتصنيف, 
والاسترجاع. كما تم دراسة اللون والمحتوى والعناصر الانطباعية بهدف التعرف إلى 
تكشيف الصور لأغراض تكشيف القصص الخيالية. 


الدراسة الثانيه: 

Ahmed Imran. A Hierarchical Decomposition Approach for Image Indexing, 
Advisor Grosky William, Wayne UState University, 1997.- 104p.- Ph.D. 
تطرح هذه الرسالة تقنية تمثيل رمزي جديد للصور مع طريقة تكشيف‎ 
لاسترجاع الصور على أساس التشابه الفراغي فيها. وتحلل هذه الطريقة الصورة‎ 
في ترتيب فراغي للسمات المختلفة فيها بشكل تكراريء والاحتفاظ في العلاقات‎ 
الضراغية بين عناصر الحسور المتنوعة. ومبداً الحلريقة هو عمل تحليل هرسي يساعد‎ 
في تحقيق فياس التشابه في عناصر الصورة مع تراكم يسمح بإيجاد نسبة تطابق‎ 
إلى مستويات متباينة من التفاصيل نزولا من العامة إلى الدفيقة. وفي كل مرحلة‎ 
يتم فيها التطابق تعطي الصورة اسم ملف يمكن به حذفها من المقارنة في حالة‎ 
عدم تطابقها.. بينما يتم ترتيب الصور المتبقية والمطابقة تنازليا من الأكثر‎ 
مطابقة إلى الأقل مطابقة وفق عناصر التشابه بما يسمح بتصفح الصور في قاعدة‎ 

البيانات والاسترجاع من قبل المستفيد. 


الدراسة الثالثه: 


Huan Jing. Color Spatial Image Indexing and Applications, 
Advisor Zabih Ramin.- Cornell University, 1998, 156p.- Ph.D. 


تستخدم هذه الدراسة تقنية جديدة لتكشيف الصور على أساس العلاقة 
الفراغية للألوان وللصورة أطلق عليها مسمى correlogram‏ وتتناول التقنية المشكلات 
المتنوعة التي تظهر في استرجاع الصورة على أساس المحتوى وتصفح لقطات 
الفيديو. وفد تم تطبيق التقنية على فاعدة بيانات تحتوي على ٠٠١‏ الف صورة 
وتعتمد هذه التقنية على تحليل المحتوى الفراغي للألوان في الصور والتشكيلات 
الاتجاهية في الصور. 
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الدراسة الرابعة: 


Chen-Hesin-Lliang, An Analysis of Image Qqueries and limage Retrieval Tasks 
in the Field of Art History, Advisor Rasmussen Edith.- University of Pittdsburgh, 
1999. - 144p.- Ph.D. 


تحقق هذه الدراسة في سمات أسئلة المستفيدين لطلبات الصور في مجال 
تاريخ yall‏ من خلال مقارنة السمات المشتركة في الأسئلة بالاعتماد على دراسات 
aa.‏ متمثلة في دراسة ale "Enserand McGregor"‏ 1۹4۲ ودرأسة Jorgensen‏ عام 
6 ودراسة INAV ale Fidel‏ . وتحاول اكتشاف أي سمات نوعية جديدة في مجال 
تاريخ الفن. وفحص العلاقات بين أغراض بحث المستفيدين ونوعيات طلبات الصور 
من خلال البحث في عناوين الصور والواصفات. 


الدراسة الخامسة: 


John Morris Zachary. An Information Theoretic Approach to Content Based 
Image Retrieval.-2000.- Ph.D. 


تناقش هذه الدراسة ملامح اللون وما يخصه في استرجاع الصور والدور 
الذي يؤديه في الاسترجاع بالمحتوى. كما تناقش إمكانية التعبير عن اللون 
بالمصطلحات الكشفية. وأجرت الدراسة الاختبارات التجريبية على قاعدة بيانات 
تشمل ٠١‏ آلاف صورة تحاول من خلالها أن تناسب شكل الأسئلة المطروحة من 
جانب المستفيدين. 

وكما يظهر من هذه الدراسات أنها انصبت على تحليل المكونات المادية 
للصور من حيث اللون والشكل والتركيب من خلال تقنيات معينة.. بينما افتصرت 
دراسة العناصر الموضوعية للصورة على قياس أداء نظم الاسترجاع من خلال 
تحليل أسئلة عينة من المستفيدين في موضوعات الصور المتخصصة في تاريخ 
الفن» وأثر كل من مجالات ele‏ النفس وعلم النفس المعرفي وعلم التكشيف وعلم 
الجمال في تكشيف قصص الخيال العلمي. ومن ثم لا يوجد دراسة تتعلق بتقييم 
أداء محركات البحث المتخصصة في الصور وإمكانية دعمها لخصائص اللغة 
العربية وهو موضوع هذه الدراسة. 

أما عن الإنتاج الفكري العربي؛ فلم يتم تناول موضوع تكشيف وتحليل 
السمات الموضوعية للصور الرقمية من Sud‏ كما لم يسبق للرسائل الأكاديمية 
تفاوله. ولا يوجد في هذا المجال سوى رسالة واحدة مسجلة هي: 
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0 أحمد أحمد عبيد. نظم تكشيف الصور الثابتة في المؤسسات الصحفية 
المصرية: دراسة نظرية وميدانية. إشراف مصطفى حسام الدين. القاهرة: 
جامعة القاهرة. كلية الآداب. قسم المكتبات والوثائق والمعلومات, 5١٠٠م‏ 
ماجستير. 

وتتناول هذه الدراسة اتجاهات المؤسسات الصحفية في التعامل مع 
مجموعاتها من الصور الإعلامية التقليدية. إلى جانب أساليب التنظيم و المعالجة 
الفنية المختلفة التي تتبعها تلك المؤسسات مع مجموعاتهاء وكيفية البحث 

والاسترجاع لتلك المجموعات. وأساليب الحفظ المادي للصور التقليدية. 


إلى جانب دراستين عن محركات البحث هما : 

١‏ - داليا نصار رياض. محركات البحث العربية على شبكة الإنترنت : دراسة 
تقييمية؛ إشراف محمود عفيفي» زين عبد الهادي. ‏ جامعة حلوان : كلية 
alo‏ قم اامكتبات و اا كم E‏ 
تناولت هذه الدراسة تقييم محركات البحث العربية من خلال دراسة 
خصائصها البحثية وواقع استخدام اللغة ce ad!‏ والعلاقة بين محركات 
البحث ومناهج المكتبات.ودور محركات البحث في تقديم الخدمة المرجعية. 

Y‏ - ضياء الدين عبد الواحد. واجهات الاستخدام لنظم استرجاع المعلومات 
المتاحة على شبكة الإنترنت : دراسة تقييمية؛ إشراف سهير أحمد 
محفوظء.زين عبد الهادي.- جامعة lyla‏ قسم المكتبات والمعتومات؛ 4١٠٠م‏ 
- ماجستير. 

ب - قراءة في أدبيات الإنتاج الواردة في الدراسة: 

إضافة إلى ما سبقء فإن هناك LE Lab‏ فكريًا منشورًا صدر في بحوث 

ودراسات يتناول عددًا من الموضوعات ترتبط ارتباطًا كبيرًا بموضوع دراستنا هذه. 

وقد تباينت الموضوعات الفرعية في الحديث عن استرجاع المادة المصورة؛ إلا أن 

هذه العناصر المتباينة أخذت جميعا شكل التكامل للوصول إلى بناء نظم استرجاع 
معلومات للمادة المصورة الرقمية. حيث يأخذ الحديث عن تناول الإنتاج الفكري 
للصور الرقمية أكثر من شكل بحسب الجوانب التي تتناول الصور الرقمية. و يمكن 

ذكر بعض الجوانب مثل :- 
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الصور الرقمية من منظور علم الحاسب في الاختزان و التكوين. 
الصور الرقمية في قياس آلات التصوير الرقمية و تقنية الكثافة. 
الصور الرقمية كنوع من أنواع التصميم الفني. 

الصور الرفمية التجارية الدعاية و التسويق . 

الصور الرقمية البحثية و التعليمية. 

الصور الرقمية في علم الاتصال. 

الصور الرقمية كأوعية للمعلومات AS pall‏ استرجاع المعلومات . 
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ويهدف هذا الجانب التمهيدي من الدراسة إلى رصد الجوانب التي اهتم بها 
الإنتاج الفكري الخاص بالصور الرقمية كأوعية للمعلومات وعمليات التنظيم والبث 
للصورة الرقمية. وسوف يتم الاعتماد على قراءة تحليلية مبسطة للانتاج الفكري 
الذي اعتمدت عليه الدراسة في البناء النظري لها.. إلى جانب التعرف إلى 
الاجتهادات dy pall‏ في هذا الموضوع وبيان مدى اهتمام الإنتاج الفكري العربي 
avec,‏ وبحث الصور الرفمية على الويب. وفد اعتمدت الدراسة على dine‏ قصدية 
الببليوجرافية ALLS‏ يمكن بالنظر إليها التعرف إلى الملامح الأساسية للانتاج 
الفكري عن الصور الرفمية في بيئة الويب. 

وتتبنى الدراسة في التحليل العناصر التالية :- 

ب - ١‏ التوزيع الموضوعي للانتاج الفكري للصور الرفمية. 

ب - Y‏ التوزيع الزمني للانتاج الفكري للصور الرقمية. 

ب - أ التوزيع الجغرافي للانتاج الفكري للصور الرفمية. 

Ole 0‏ و مؤسسات الصور الرقمية. 

ب - ١‏ الإنتاج الفكري العربي عن الصور الرقمية. 

ب - ١التوزيع‏ الموضوعي للانناج الفكري للصور الرقميه :- 
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تباينت الموضوعات الفرعية للحديث عن استرجاع الصور؛ إلا أن هذه 
العناصر المتباينة أخذت جميعا شكل التكامل للوصول إلى الصور النهائية لبناء نظم 
استرجاع معلومات الصور الرقمية. وقد جاءت مصادر الدراسة في ترتيب عددي 
يوافق ترتيب الموضوعات من الأهم إلى الأقل أهمية ؛ حيث يوضح الجدول التالي 
ترتيب الموضوعات بحسب إحصاء كل منها :- 


فئات الموضوعات بحسب الترتيب العددي 


a‏ الموضوع عدد دد مصادر الموضوع 
JB MN I 7d‏ 
| تنظيم الصور الرقمية | Y.‏ 
الوصف الفني calidad‏ الضبور | " 
| تشتيانت dud ll squad‏ | 
| تطبيقات الصور الرقمية | 0 
| المعلومات !]$3922 | 0 


-: الأولى‎ atati [x] 
مصدرًا بموضوع إستراتيجيات بحث‎ YO اهتمت أكثر المصادر بعدد‎ 
واسترجاع الصور من بالتعرض لدراسة كيفية عمل محركات بحث الصور وآليات‎ 
Berinstein, paula. Turning visual : image search engines on the web, البحث بها ؛ كدراسة‎ 
Anall التي تتحدث عن الخطوط العريضة للتعامل مع الصور‎ online inc., 1998 
وطبيعة أساليب البحث المتبعة مع الصور كوسيط لحمل المعلومات على الويب. أيضا‎ 
Thomason, Larisa. Promotion Tip: Search Engines Get The Picture, 2002. دراسة أخرى هي‎ 
و تهدف نماذج هذه الدراسة إلى عرض جوانب مخصصة لبحث و استرجاع الصور‎ 
الرقمية دون باقي أنواع المعلومات المصورةء هذا فضلا عن الدراسات التي تناولت‎ 
الآليات العامة لبحث مصادر الويب التي يمكن استخدامها مع تنظيم و بحث الصور‎ 
الرقمية. وعملت دراسات إستراتيجيات البحث على تناول تعامل محركات بحث الويب‎ 
غير‎ pall مع ملفات الصور الرقمية و عمليات البحث في النص المصاحب لملفات‎ 
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أن الباحث يرى أن هذه الدراسات قد تعاملت بعمومية محركات البحث بالتركيز على 
آليات بحث النصوص دون التأكيد على اختلاف ملفات الصور الرقمية. ثم دراسة 
Frequently Asked Questions - Picture Search. Fast Search & Transfer ASA, 2002‏ التي عملت 
على تبني مسح يشمل مجموعة من مستخدمي الصور ثم طرح eal‏ التساؤلات التي 
تتعلق ببحث واسترجاع الصور الرقمية من محركات بحث الصور على الويب. أيضا 
دراسة Notess, Greg. Searching beyond text : issues with multimedia searching, information‏ 
today, 2000.‏ وتمثل الدراسة أفضل نماذج تحليل استرجاع و بحث الصور الرقمية على 
الويب. حيث تعرض لنماذج استرجاع الصور بالكلمات المفتاحية والتصفح الموضوعي 
للمواد المصورة التي أضحت غاية مستخدمي الوب أك سرع جه ا 
وهناك أيضا دراسة Promotion Tip: Search Engines Get the jlgiaq Larisa Thomason‏ 
-Picture‏ وهي تهدف إلى عرض نماذج جوانب مخصصة لبحث واسترجاع الصور 
الرقمية دون باقي أنواع LUN‏ المصورة. هذا فضلا عن تناولها الآليات العامة 


لبحث مصادر الويب التى يمكن c. (94 eset ea lgal. Lawn‏ الصور الرقمية. 0 


-: الثانية‎ AA! pg 
يختلف تنظيم الصور الرقمية بين مفهوم علم الحاسب الآلي وعلم‎ 
المعلومات في أن الأخير يعتمد على تحويل وسيط الصورة إلى وسيط النص للتعبير‎ 
عن المحتوى الموضوعي. ويتمثل ذلك في عملية التحليل الموضوعي للصورة بجانب‎ 
الوصف المادي في تسجيلة واحدة.وهذا هو المعني به هنا في تنظيم الصور‎ 
الرقمية.وقد أخذ تنظيم الصور الرقمية المكانة الثانية في اهتمام الإنتاج الفكري‎ 
مصدرًا. ويختلف الحديث بين إستراتيجيات البحث و‎ ٠١ عن صور الويب بعدد‎ 
تنظيم الصور في أن الأخير إنما يعنى به الباحث الحديث عن أساليب المعالجة‎ 
الفنية الموضوعية دون الشكلية المادية وتضمن الحديث عن تنظيم ملفات الصور‎ 
استخدام‎ í dbr عنصرين هما ؛ استخدام قوائم رؤوس الموضوعات | اللغة‎ 

الكلمات المفتاحية الحرة اللغة الطبيعية . ويعكس اختيار أحد العنصرين 
السابقين الأسلوب المتبع في بحث و استدعاء الصور ؛ حيث يبنى على قوائم 


Notess, Greg. Searching beyond text: issues with multimedia searching, (*) 
information today, 2000 
Thomason, Larisa. Promotion Tip: Search Engines Get The Picture, 2002 (Y) 
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المصطلحات استخدام المكانز أو القوائم العامة. كما يبنى على أسلوب الكلمات 
الحرة الويب بناء آليات بحث مثل استخدام البحث الحر wild card.‏ ويعكس ذلك 
دراستان من الدراسات هما؛ الأولى دراسة Jake Cristine‏ بعنوان: state of the arts:‏ 
A imet applications for indexing images‏ ودراسة Olivia Frost‏ و Anna Noakes‏ بعنوان 
E Images Using Broad Classification Categories‏ وقد تبنت الدراسة الأولى 
أسلوب التنظيم التكشيف الحر باقتباس الكلمات ذات الدلالة الموضوعية من 
النص المصاحب Cala!‏ الصورة أو من خلال الاعتماد على حقول HTML‏ داخل بنية 
صفحات الويب» ومدى إمكانية استخدام ذلك في محركات البحث. Lal‏ الدراسة 
الثانية. فقد تبنت أسلوب الاعتماد على قوائم المصطلحات المرتبة منطقيًا بحسب 
أنماط في خطط تصنيف المعرقة من العام إلى الخاص. واعتمدت بعض الدراسات 
التي سارت على هذا النحو بعض أشكال التصنيف العالمية مثل تصنيف مكتبة 


الكونجرس LCC‏ أو تصنيف ديوي العشري DCC‏ 
Atal! [xj‏ التالثة :— 


GES مصدرًا‎ ٠١ 24a) الحديث عن الوصف الفني لملفات الصور‎ sla 
مكمل لموضوع تنظيم ملفات الصورء وذلك لاكمال الحديث عن المعالجة الفنية‎ 
لأوعية الصور الرقمية. وتتركز دراسات الوصف الفني على معايير و أساليب‎ 
الوصف الشكلي لعناصر ملفات الصور دون المحتوى الموضوعي منها مثل ؛ المؤلف‎ 
و مقاس الصورة ... وغيرها. وعملت أيضا‎ KBs و تاريخ التقاط الصورة و الحجم‎ 
على محاولة الوصول إلى تسجيلات الصور الرقمية المعيارية بتكوين حقول الوصف‎ 
المادي. فضلا عن مناقشة طبيعة الويب و طبيعة بناء التسجيلات البيليوجرافية‎ 
داخل مختلف أنواع محركات بحث الصور المحددة المخصصة ومحركات بحث‎ 
Metadata: Standards for Retrieving بعنوأن:‎ Rusch-Feja Diann الويب. وتمثل دراسة‎ 


WWW Documents (and Other Digitized and Non-Digitized Resources‏ أفضل ما قدم فى 
هذا المجال وقد تناولت هذه الدراسة تحديدًا إظهار تحول المفهوم والمصطلح من 


Cristine, Jake. state of the arts: current applications for indexing images, 1999. O) 


Frost, C. Olivia and Noakes, Anna. Browsing Images Using Broad Classification (Y) 
Categories, the University of Michigan, [2000?], cited 1/6/2002. 
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حقول الوصف الفني إلى حقول الميتاداتا التي استخدمت للدلالة على حقول الوصف 
ا Leu‏ ركزت دراسة Metadata Standard for Digital Images‏ :01635 على أحد 
clin pubes‏ الميتاداتا وهو معيار 01635 لبناء التسجيلات اليبليوجرافية للمادة 
المصورة الرفمية في بيئة الويب. وعنيت بعض الدراسات بالتركيز على أحد 
معايير بناء الميتاداتا Metadata‏ مثل دراسة DIG35: Metadata Standard for Digital‏ 
Images. XMLCoverPages, 2002‏ في تبني معيار 01635 لبناء التسجيلات الببليوجرافية 
للصور الرقمية في بيئة الويب. ويكتمل بذلك جانبا الحديث عن المعالجة الفنية 
للصور الرفمية. 
موضوعات أخرى:- 

تعد الموضوعات الثلاثة السابقة أعمدة بناء هذه الدراسة؛ إلا أن الإنتاج 
الفكري للصور الرقمية لم يقتصر عليها فقط وإنما اشتمل على موضوعات أخرى مثل 
تقنيات الصور الرقمية على الويب وقد ذكرت الكثير من دراسات تنظيم ملفات الصور 
Areal‏ عرض الصورة و النحكم في المقاسات المختلفة أئناء عرض نتاكج بحث 
محركات البحث. وركزت بعض الدراسات على تقنية درجة الكثافة للصور الرقمية 
Lg 1 «9 «Resolution‏ دراسة Reichmann, Michael H. Understanding resolution, luminous‏ 
landscape, 2002‏ التي عنيت بأهمية هذه التقنية والتحكم بها في قواعد بيانات الصور. 
ce ap uad beta c o ce aaa ad‏ على audes‏ 
محدد مثل دراسة الخدمة الفنية الاستشارية للصور. وهي DIMP: The Use of Images to‏ 
Support Instruction and Presentation. TASI Technical Advisory Service for Images, 2003‏ 
حيث تم التركيز في هذه الدراسة على استخدام الصور كنوع من عرض المعلومات 
المصورة و تقديم المعلومات. وفد تم التأكيد في الفصل الثاني على مثل هذه 
التطبيقات. يأتي في نهاية هذا العرض موضوع المعلومات المصورة حيث تناولت 
بعض الدراسات الصورة من المنظور العام كوعاء معلومات. ويمكن اعتباره الخلفية 
الأساسية لتاريخ المعلومات المصورة ثم دورها في الاتصال و نقل المعلومات. مثل 
ذلك دراسة 5/10/2003 Forger, Garry. Image, University of Arizona Library, 2002 7, cited at‏ 


Rusch-Feja, Diann. Metadata: Standards for Retrieving WWW Documents (and (1) 
Other Digitized and Non-Digitized Resources), Astronomical Society of the Pacific, 
1998, cited at 2003 

DIG35: Metadata Standard for Digital Images, XML CoverPages, 2002 (Y) 
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التي يتضح من عنوانها الحديث عن الصورة الرقمية كوحدة جديدة من أشكال 
المعلومات. 

ب - Y‏ التوزيع النوعي للانتاج الفكري للصور الرقمية :- 

عملت الدراسة على مسح مصادر المعلومات التقليدية و الرقمية التي تتعلق 
بتنظيم وبحث الصور الرقمية في بيئة محركات البحث. وأثرت الخلفية التاريخية 
للانتاج الفكري الذي بدا فقط في النصف الثاني من عقد التسعينات على قلة توافر 
المصادر التقليدية في هذا الموضوع. وكان السواد الأعظم من مصادر المعلومات 
في الشكل الرقمي مصادر الويب . تمثلت مصادر الدراسة في التعامل مع مقالات 
الدوريات على الويب و الأوراق البحثية المقدمة في مؤتمرات مناقشة تنظيم مصادر 
الويب. ايضا المعلومات الإلكترونية في هيئّات تنظيم الويب والصور الرفميةء 
والدراسات الأكاديمية النادرة التي تتعلق بتنظيم معلومات الصور. 


واستمانت الدراسة ببعض قواعد البيانات المتخصصة في ذلك مثل: 
Dissertation Abstracts International UMI‏ إلا أن عمليات بحث هذه القواعد قد أشارت 
إلى ندرة الاهتمام بتنظيم الصورة كوعاء للمعلومات, في حين اهتم معظمها بما 
يتعلق بالصور الرقمية و التخزين على الحاسبات الآلية و ما يتعلق بها من تقنيات 
مثل: ‘Content Based Image Retrieval‏ حيث استخدام الألوان و الشكل shape‏ لحفظ 
وتنظيم الصورة الرقمية بعيدًا عن مفاهيم التكشيف أو المعالجة الفنية للمعلومات. 
ومن أمثلة الدراسات الأكاديمية دراسة Davis, Eric T.. A PROTOTYPE ITEM-LEVEL INDEX‏ 
TO THE CIVIL WAR PHOTOGRAPH COLLECTION OF THE OHIO HISTORICAL SOCIETY,‏ 
Advisor Zeng, Marcia Lei, Kent State University School of Library and Information‏ 
.Science,Master-thesis, 1997‏ تعد الدراسة السايقة أقرب المصادر الأكاديمية لتنظيم 
الصور. إلا أنها قد اهتمت بالتنظيم التقليدي لأوعية معلومات الصور التقليدية في 
غير بيئّة الويب. 


ب - Y‏ التوزيع الزمني للانتاج الفكري للصور الرقمية :- 


بدأت الصور الرقمية في الظهور في تاريخ يسبق تاريخ ميلاد الويب ؛ حيث 
مع خروج متصفح موزايك NCSA Mosaic‏ عام 1447م. Was‏ عن أن الدراسة لا تتناول 
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المواقع الأولى للويب وإنما تتناول مواقع محركات بحث الويب و هي فترة زمنية 
أخرى لاحقة لظهور الويب. إن هذا يعكس أن الإنتاج الفكري عن الصور الرقمية في 
بيئة الويب قد بدأ في النصف الثاني من عقد التسعينات. واعتمدت الدراسة في 


الترتيب الزمني لمصادر الدراسة 


سنوات النشر عدد مصادر الدراسة 
| 11م ١‏ | 
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يشير الجدول السابق إلى الفترة الزمنية بين خروج الويب و بداية ظهور 
مشكلات تنظيم الصور الرقمية عليها التي بلغت ثلاثة أو أربعة أعوام. وتعكس 
أعداد مصادر الدراسة الواقع المنطقي للانتاج الفكري عن الصور الرقمية 
وتضاعف أعداد ملفات الصور الرقمية على الويب ثم ظهور هذه المشكلة في مواقع 
بحث الويب ؛ حيث كان عام VAAT‏ أقل سنوات النشر في المصادر ثم أصبحت 
العلاقة طردية بين عدد المصادر و سنوات النشر كما يوضح الجدول السابق. 
يخالف ذلك عام 7٠٠١4‏ حيث بدأت الدراسة في استعراض الإنتاج الفكري daz‏ دون 
التعرض للاقتباس من أي منه. 
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ب - ؛ التوزيع الجفرافي للانتاج الفكري للصور الرقمية :- 

شكلت المصادر الإلكترونية النسبة العظمى من مصادر الإنتاج الفكري لبناء 
هذه الدراسة. وعلى ذلك فإن الدراسة لم تعتمد على بيئة النشر التقليدية ذات 
sca te Sig id ca S Ts Dad‏ على اة Agios NI das all‏ الوت :> 
غير أن ذلك التوزيع الجغرافي مع التوزيع اللفوي القادم إنما يعكسان تفوق الإنتاج 
الفكري الأجنبي على نظيره العربي. وهذا إنما يأتي من أن ميلاد مصادر 
المعلومات الرقمية جاء على يد العالم الغربي أولاء يؤكد ذلك النشأة الأصلية للويب 
في وزارة الدفاع الأمريكية عام ARPANET VATA‏ كمشروع للأمن القومي ثم تحول 
إلى الشبكة العالمية ثم ظهور الويب. و لم يعبر عن بيئة النشر العربية سوى القليل 
من المقالات Gils fie‏ عطية في الحديث عن تكشيف الصور. ثم زين عبد الهادي 
في الحديث عن محركات بحث الإنترنت 


ب - o‏ هيئات ومؤسسات الصور الرقمية :- 


اعتمدت الدراسة على الإنتاج الفكري التابع لبعض الهيئات الداعمة لتنظيم 
ملفات الصور الرقمية على الويب. وقد تعرضت الدراسة لهذه الهيئات في عنصر 
المعالجة الفنية للصور الرفمية حيث تختص بعض الهيئات بإنتاج المعايير الملائمة 
لأوعية معلومات الصور الرقمية. فيما يختص البعض الآخر بوضع معايير وص 
مصادر الويب و من بينها المصادر الع كيد وأوضحت مصادر الدراسة أن أهم 
هيئات الصور الرفمية على الويب هي «Technical Advisory Service for Images TASI‏ 
حيث تقف هذه الهيئة على أهم دراسات ومصادر الإنتاج الفكري حول تنظيم 
ومعالجة الصور الرقمية في بيئة الويب. خلاف الهيئات الأخرى التي تهتم فقط 
بتبعة معايير وصف و تحليل 35s]!‏ هذا فضلا عن الاهتمام بتقنيات و الات 
الصور الرقمية و عمليات تحويل الصور للشكل الرقمي. إضافة إلى تقديم أنواع 
التدريب المختلفة بحسب مرحلة التعامل مع الصور الرقمية. وتقترب الهيئات 
الأخرى في درجة الاهتمام بالصور الرقمية على الويب ويوضح الجدول التالي بعض 
هيئات الصور الرفمية :- 


= fY يت‎ 


هيئات الصور الرقمية على الويب 


| اسم هيئات الصور | الاسم الاستهلالي‎ | 
| DC | Dublin Core ý © Ne 
| I3A | The International Imaging Industry Association 

| ELISE | Electronic Library Image Service for Europe 

| NISO | National Information Standards Organization 

| VADS | Visual Arts Data Service 

| VRA | Visual Resources Association 

| TASI | Technical Advisory Service for Images 


يوضح الجدول السابق أن معايير وصف و معالجة الصور الرقمية عملت 
كنقطة تقابل بين هيئات تنظيم الويب عامة و المتخصصة في الصور الرقمية أو 
المواد المرئية. غير أنها تساوت جميعا في الحد الأدنى من الاهتمام بحصر 
وتنظيم الإنتاج الفكري عن الصور الرقمية.على الجانب الآخرء يوجد معهد أبحاث 
معلومات الصور الرقمية Institute for IMAGE DATA Research‏ التابع لجامعة University of‏ 
‘Northumbria at Newcastle‏ حيث يهتم بالأوراق البحثية حول معالجة و تنظيم الصور 
الرقمية. 

ب - ١‏ الانتاج الفكري العربي عن الصور الرقمية :- 

عكست مصادر الدراسة ضعف الإنتاج الفكري العربي في نشر مصادره عن 
البيئة الرقمية dale‏ وتنظيم الصور الرقمية خاصة. وقد اعتمدت الدراسة كلية على 
جمع الإنتاج الفكري الأجنبي باستخدام بيئة الويب وقد اقتصرت المصادر العربية 
النادرة على المقالات العامة عن محركات البحث واليات البحث المستخدمة بها. 
عكست ذلك الدراسة التجريبية لزين عبد الهادي بعنوان محركات البحث على 
شبكة الإنترنت2 واهتمت هذه الدراسة فقط بالآليات العامة لمحركات بحث الويب 
دون التطرق من قريب أو بعيد إلى تنظيم و بحث الصور الرقمية.!'' وسارت 
الدراسات الأخرى على الدرب نفسه؛ كدراسة خالد محمد رياض عن المقارنة 


)© زين عبد الهادي. محركات البحث على شيكة الإنترنت: دراسة تجريبية مقارنة. مجلة المكتبات 
والمعلومات العربية؛ ip‏ أبريل .٠١ YY‏ 
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العامة بين ]85^ محركات اس ' إلى جانب المقالة الرقمية عن البحث في 
محركات البحث لمساعد بن صالح ا ' إلا أن دراسات أخرى قد اهتمت 
بتنظيم ومعالجة مصادر الويب مثل دراسة Gils‏ ا Aulae‏ بعنوان جهود 
تصنيف المعرقة في البيئة الإلكترونية. واهتمت T‏ بتتبع أنواع تنظيم وتصنيف 
المعرفة على الويب لوضع شكل يلائم مضادر cual‏ يضاف إلى ذلك 2,15 
جوانب تكشيف الصور Gilg!‏ محيي الدين عطية بعنوان: تكشيف الصور بين العلم 
والتعلم التي عملت على إبراز أهمية تدريب الطلاب على التعامل مع محتوى الصور. 
ومحاولة التعرف إلى المعاني المتباينة داخل الصورة الواحدة. وكان ذلك في 
عرضه لمحتوى عام يشمل القضية الفلسطينية APY‏ وقد تناولت الدراسة العوامل التي 
تقف وراء تباين اختلاف تكشيف الصور من بيئة إلى أخرى. 


عاشرًا محتويات الدراسة :— 


تتكون الدراسة من خمسة فصول بجانب عرض المقدمة وملحق الرسالة, 
وكان تتابع الفصول كالتالي:- 

الفصل الأول تعرض لأنواع الأدوات الأساسية لبحث الويب من محركات 
وأدلة بحث بجانب قواعد بيانات الويب. إلى جانب تقسيم مقترح لأنواع محركات 
البحث على الويب وصولا إلى محركات بحث المادة المصورة والحديث بتركيز اكثر 
على نظم استرجاع الصور الرفمية. 

الفصل الثاني تناول الحديث عن أوعية المعلومات المرئية وتبنى هذا 
الفصل شكلًا محددًا لتقسيم أوعية المعلومات المرئية على الويب والحديث عن هذه 
الأنواع انتهاء بالصور الرقمية الثابتة بموضوعاتها العلمية والإعلامية والعامة. 


)!( خالد محمد رياض. أدلة ومحركات بحث شبكة الإنترنت: دراسة مقارنة -. الاستراتيجية العربية 
الموحدة للمعلومات في عصر الإنترنت ودراسات أخرى. الاتحاد العربي للمكتبات والمعلومات. تونس. 
(أكتوبرةة9١). WA‏ ص. 

(Y)‏ مساعد بن صالح الطيار. محركات البحث العربية وطرائق البحث فيها. - الجزيرة. Yir‏ تاريخ 
الاستشهاد .Y*-Y/1-/Y*‏ مسار http://www.al-jazirah.com.sa/evillage/22112001/wrl.htm‏ 

(T)‏ هانئ محيي الدين عطية. جهود تصنيف المعرفة في البيئة الإلكترونية: دراسة استكشافية -.الأكاديمية 
للمكتبات والوثائق والنظم المعلوماتية, ع١ (Test)‏ ص ص -لالا. 

-. هانئ محيي الدين عطية. تكشيف الصور بين العلم والتعلم: ورقة في ملف القضية الفلسطينية‎ (t) 
YEN uaa أسيوط: المؤتمر القومي الخامس لاختصاصيي المكتبات والمعلومات والأرشيف في‎ 
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الفصل الثالث تناول معالجة الصور الرقمية وذلك في قسمين تناول في 
القسم الأول Ala‏ المعالجة الفنية للصور ALES!‏ ومحاولة التطرق إلى بعض المعابير 
التي تتبنى تحليل ووصف الصور الرقمية مع التركيز على معيار دبلن كور opalin‏ 
المختلفة. وتناول القسم الثاني الحديث عن المعالجة الآلية لخصائص اللغة العربية 
وأثرها على تشكيل آليات الاستدعاء والبحث على الويب. 

الفصل الرابع فام بدراسة تجريبية وذلك بالتطبيق على عينة غرضية من 
محركات بحث الصور الثابتة» واختبار مجموعة من خصائص هذا النوع التي تدور 
في مجملها حول تنظيم واستدعاء الصور الثابتة. بالإضافة إلى اختبار بعض آليات 
بحث اللفة العربية التي اقتصرت في اختبارها على محرك بحث Google.‏ 

الفصل الخامس عمد إلى دراسة طبيعة ترشيح المعلومات المصورة على 
الويب/ ودراسة الخصائص التي يتحلى بها مرشح الصور الرقمية داخل محركات 
البيئة العربية والإسلامية. 

الفصل السادس اقتصر على عرض المواصفات المقترحة لبناء محرك 
Cox‏ صور ثابتة يدعم خصائص اللغة العربيةء وذلك ابتداءً من عمليات اختيار 
ملفات الصور الرقمية مرورًا بتنظيمها ثم آليات البحث والاستدعاء للصور باللغة 
العربية يمكن من خلالها 5 تحقيق أفضل درجة تحقيق لنتائج البحث أمام 
المستفيدين. 


0 9 0 
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الفصل الأول تيع صو سو سح A.‏ 
البحث على الويب 


١‏ التمهيد 

١‏ الويب 

١‏ أدوات البحث على الويب 
۱ محركات البحث 

١‏ محركات بحث الصور 
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مفاهيمه وأساليبه وأنواعه 


۱ التمهيد 


إن الإنترنت بوصفها مستودع المعلومات الإلكترونية للعالم قد دخلت في 
تطبيقات عدة. واتسع مجالها حتى وسع كل موضوع من موضوعات المعرقة. مما 
جعل من عملية تنظيمها أمرًا ELE‏ على كثير سن الستخعسمسين. فلقد شمت 
الإنترنت معلومات في المجالات كافة وبكل أشكال المواد المسموعة والمقروءة 
والمصورة. وهذا الخضم الهائل متعدد الموضوعات مختلف الأشكال يحتاج إلى 
طرق بحث وأساليب مختلفة تبدا بابسط الطرق وهي التصفح وتنتهي بأليات 
استرجاع متطورة. ومع تزايد مواقع الإنترنت والتي يقدر عددها بملايين gloat!‏ 
ومئات أخرى تضاف كل cage‏ ومع إضافة أنماط جديدة من التقنيات تصبح عمليات 
البحث والاسترجاع التى تعتمد في محورها على استخدام محركات البحث او algal‏ 
البحث في غاية الأهمية. 
إن محور هذا الفصل هو الحديث عن أدوات البحث على الإنترنت وأنواعها 
المختلفة. ثم الحديث عن المادة المصورة كوسيط معلومات تضمه الإنترنت وهو 
محور هذه الدراسة (ES‏ ثم انتهاء بالفارق بين استرجاع المادة المصورة واسترجاع 
النص. 
تعريف الإنترنت 
بعيدًا عن الخوض في نشأة الإنترنت وتطورهاء فإن الحديث سوف يكون 
متصبًا على ماهية الإنترنت من المنظور المعلوماتي. ولطالما تعددت تصنيفات 
الإنترنت من هذا المنظور بين am pe‏ وقاعدة بيانات. وشبكة معلومات. ويقترح 


A 


الباحث تعريفًا إجرائيًا بأن تصنف الإنترنت على أنها مصدر معلومات يتم اقتناؤه 
في المكتبات تحت مسمى خدمة الإنترنت وإتاحة هذا المصدر كما تتطلب طبيعة 
الخدمة في قاعات مخصصة لذلك وتقديم طرائق مختلفة في التعامل مع 
TNT‏ 


1/1 الويب 
إن هوية الإنترنت الحقيقية التي توارت خلف بريقها ولمعان عرض 
المعلومات المبهر في وسائط سمعية وبصرية ونصيةء ليست هي الويب. فالأخيرة 
ليست سوى جزء من الإنترنت يتكامل مع غيره من الأجزاء Sal page)‏ وايس, 
بروتوكول نقل الملفات. وتيلنت) التي تكون في مجموعها الإنترنت أو الشبكة 
العالمية. والويب هي الجزء المعني بالوسائط المتعددة والروابط الفائقة القائمة 
على استخدام لغة الترميز المعيارية. وهي ما يعنينا في هذه الدراسة. 
Lordy‏ يلي تعريف بمصطلحات الويب كما سيتم التعامل معها في هده 
الدراسة := 
١1‏ بنية الويب ومكوناته 
إن الويب كما سلف الذكر هي الجزء الأكثر شهرة واستخدامًا بين 
مستخدمي الإنترنت. وهذا الجزء له بنية خاصة وتكوين محدد يتم استخدامه في 
عرض المعلومات واسترجاعها من مستودعاتها. وتعتمد الويب على مكونات أساسية 
في تكوين هذه البنية ذكرتها Cheryl Gould‏ كما see‏ 
m‏ الرابط: هو أداة للوصل بين صفحتين من صفحات الويب أو وسيط من 
وسائط المعلومات أو وسيط آخر داخل مواقع الويب مثل ربط الكلمات 
المفتاحية بالمادة المصورة المعبرة عنها. 
m‏ الصفحة الدليلية: وهي الصفحة أو الموقع الذي يصل إليه متصفح الإنترنت 
حالة الدخول إلى الويب وفتح برنامج تصفح (à E‏ وتكون هذه الصفحة 
مسجلة من قبل بواسطة المستخدم. 


)!( غولد. تشيرل. البحث الذكي في الإنترنت: أدوات وتقنيات للحصول على أفضل النتائج. ‏ الرياض: 
مكتبة Aall‏ فهد الوطنية. VEA aY N‏ ص. 


صفحات الويب : هي الوحدات التي تتكون منها «gl ga!‏ وهي تعد الوحدة 
الصغرى من الوحدات المكونة للويب» وهي تحتوي على معلومات متعددة 


الأشكال قد تكون مرئية أو مسموعة أو مجرد نصوص وفقرات. 


Hypertext الترميز المعيارية للنص المترابط : وهي اختصار للمصطلح‎ Aal 
وهي إحدى لغات البرمجة التي تستخدم في تصميم‎ «Markup Language 
3929 صفحات وموافع الويب. وما يمكن مشاهدته للدلالة على ذلك هو‎ 
URL. فى نهاية امتداد كل عنوان من عناوين الويب‎ htm أو‎ html مصطلح‎ 


windows sal gill الإنترنت: وهو البرنامج المستخدم مع نظم تشغيل‎ riaa 
على مختلف إصداراتها. ومن خلاله يحم قراءة ملفات الإنترنت وزيارة كل‎ 
internet explorer, Netscape البرامج المستخدمة في ذلك هي‎ eal موافعها. ومن‎ 


.navigator 


موقع الويب : اسم لمجموعة من الصفحات مكتوبة بلغة html‏ ومعتمدة على 
الروابط الفائقة التي لا تكون مرتبطة فقط في التصميم وإنما ايضا في وحدة 
الموضوع. 

وتعتبر المكونات السابقة هي التطبيقات أو الأدوات التي تعمل على الويب, 
حيث تعتمد الويب إضافة إلى ذلك على المكونات المادية مثل الخادمات 
ووسائل الاتصال التقليدية والمتقدمة. 


ويضيف الباحث لما سبق ما يلي: 


مسار الموقع :URL‏ ويطلق على مسار موافع الويب اختصار اهلا الدال على 
مصطلح محدد المصادر الموحد. ويتألف مسار مواقع وصفحات الويب من 
مجموعة من الأجزاء تتكامل في وحدة واحدة. ولكل جزء منها مفهوم محدد 
يساعد في تخصيص المعلومات وفق ما تكون عليه في الموقع. ويعد مكان 
المسار رابطًا للخادم الذي يحوي صفحة الويب المطلوبة ويتجلى في مسار 
مواقع الويب الدليل على صفحة الويب كجزء من الإنترنت؛ حيث تأتي حروف 
www‏ المعبرة عن الويب مصطلح (world wide web‏ بعد حروف http‏ المعبرة عن 
بروتوكول تعامل -Hyper Text Transfer Protocol ci iW!‏ 
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ويتكون محدد الويب في أدنى حالاته من قسمين فقط مثل http://‏ 
www.google.com‏ الذي یتکون من فسمين أو لهما هو بروتوكول التعامل مع الويب 
Lal «http‏ الثاني فهو مجال id‏ الموفع Domain name‏ مثل -www.google.com‏ ومن 
الممكن أن يشمل المسار ell‏ أخرى مثل مسار http://www.usps.gov/consumer/‏ 
ipats.htm‏ فإن الجزء الثالث بعد البروتوكول والمجال النطاق يسمى directory‏ وهو 
في العنوان السابق .consumer‏ أما الجزء الأخير من المسار يسمى الموضوع 
المخصص specificfile‏ وهو في المثال السابق pats‏ وعلى هذا فإن محدد المصادر 


يمكن أن يشتمل على أجزاء عدة بحسب تخصص الصفحة التي يريد المستخدم 
الوصول إليها. 


وتختلف البروتوكولات في مسارات cu yx‏ حسب المعلومات التي 5 تقدمها 
هذه الموافع, وهي كما يلي:- 


الجدول رقم )1-1( يوضح أنواع برتوكولات الإنترنت 


الخدمة البروتوكول 
بروتوكول نقل ال الفائق http:// Hyper Text Transfer Protocol‏ 


ftp:// File Transfer Protocol بروتوكول نقل الملفات‎ 


inailto: Mail Protocol بروتوكول البريد الإلكتروني‎ 
News: News Protocol بروتوكول مجموعات الأخبار‎ 
Gopher: gopher protocol | بروتوكول بحث الملفات‎ 
| Telnet: telnet protocol | عن بعد‎ das II بروتوكول‎ 


واستكمالا لتحليل مسار مواقع الويب. فإن الشق الثاني وهو المجال (GU‏ 
Domain‏ يتكون من عنصرين أو لهما: التعريف بالويب www‏ وثانيهما اسم الموقع 
مثل Google‏ في «www.google.com‏ ثم تليه الحروف الدالة على نوع الموقع مثل com‏ 
في المثال السابق. وتختلف الحروف باختالاف أنواع مواقع الويب كما يلى :- 
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الجدول رقم (Y-Y)‏ يوضح أنواع صفحات الويب 


النوع الاختصار الاسم 

Commercial sid com | : Adi gal 

اقع تعليمية أكاديمية | Educational 1 | 7 ` edu‏ 

Governmental | gov | Adis مواق‎ | 
| Military — | mil | eae. | 
| Networks | net | مواقع للشبكات‎ | 
| | | mx | 

For non profit | org | الهيئات غير الهادفة للربح‎ 


الميتاداتا : ارتبط مفهوم الميتاداتا بالاستخدام مع البيئة الرقمية للتعامل مع 
وصف مصادر الويب. وهناك تعريفات عدة للميتاداتا نسرد منها تعريف 
Steven J. Miller‏ الذي تناول الميتاداتا من حيث المعالجة الفنية والتنظيم 
لمصادر الويب ail‏ الميتاداتا = البيانات عن البيانات : أي lal‏ حقول بيانات 
رقمية يتم تنظيمها لتكشيف وتجميع ووصف وتنظيم المعلومات على الخط 
المباشر ومصادر e qm‏ وتعريف Chris Taylor‏ حيث عرف الميتاداتا على 
أنها بيانات معيارية تم بناؤها لوصف خصائص المعلومات الرقمية؛ وهي 
تابه كي خصاكصها س الشهوسة فال المكفيات ٠ ٠‏ عرف eal‏ 
الميتاداتا بأنها مجموعة من حقول البيانات الرقمية الهادفة لوصفة وتنظيم 
المصادر الرقمية . 


١‏ البحث داخل الويب 


إن الحصول على المملومات الصحيحة هو غاية عملية Sto TOTUM‏ هده 


العملية قد تختلف في درجاتها من حيث الكيفية (طريقة البحث) والأداء (نتيجة 


الاسترجاع). فمسألة البحث على الويب لها طرق Bate‏ ويعتمد الباحثون في اختيار 


Miller, Steven J. Metadata and Cataloging Online Resources, University of 
Wisconsin-Milwaukee Libraries, 2003, Visited at 10/5/2004, 
http://www.uwm.edu/^mll/resource.html 

Taylor, Chris. metadata, University of Queensland Library, 2003, Visited at 
10/5/2004, http://www.cybrary.uq.edu.au/iad/mainmenu.html 
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وسيلة البحث لاسترجاع معلومات الويب على مستوى مهارة المستفيد في البحث 
واستخدامه للويب. وتحتاج كل وسيلة لبحث الويب إلى ادوات مخصصة مثل 
الاعتماد في المراحل المتقدمة على استخدام أدلة ومحركات البحث. 

وقد أوضحت الباحثة Laura Cohen‏ ست وسائل أساسية لإيجاد المعلومات 
داخل الويب Wag‏ في مقالها الذي جاء بعنوان how to find information on the internet‏ 
وهو الذي يعتبر في رأي الباحث عنوانا أعم من المحتوى المقصود؛ لأن محتوى 
المقال كان فد تركز على البحث داخل الويب وليس الإنترنت كما اشار العنوان. 
وتضمنت هذه الوسائل طرائق الوصول السابقة مع اخرى جاءت كما يلي:- 
.١‏ الاتجاه مباشرة إلى موقع المعلومات عن طريق استخدام مسار محدد 

"URL" للمعلومات‎ 

.Y‏ التصفح باستخدام برنامج تصفح الإنترنت. 
.٣‏ الاتصال بإحدى مجموعات الأخبار أو مجموعات المناقشة على الويب. 
t‏ استكشاف المعلومات غير المرئية Jala‏ الويب من خلال بحث قواعد البيانات. 
0. تصفح أحد أدلة البحث على الويب. 
51. الاتجاه إلى أحد محركات البحث. 


غير أن وسائل البحث السابقة تعتمد في الوصول إليها على خبرة 
المستفيدين في البحث. وإذا ما أخذنا في الذهن صفة غير المتمرسين في بحثهم 
الويب» فإننا نتجه لوصف الجزء الأكبر من مستخدمي الويب» مما يجعل طرق 
البحث باستخدام أدوات البحث أو عنوان الموقع هي الطرق الأكثر استخداما في 
الوصول إلى المعلومات. ويمكن بيان كيفية استخدام وإجراءات كل طريقة من 
طرائق البحث السابقة كما يلي :- 


(URL) استخدام مسار أو عنوان موقع المعلومات‎ 0١ 

إن استخدام هذا الأسلوب يتأتى من معرفة المستخدم لعنوان أو مسار موقع 
المعلومات المطلوبة على الويب. وذلك LUS‏ عنوان الموفع المطلوب في الفراغ 
المخصص لكتابة اسم الموقع تماما كما هو؛ إلا أن من أهم خصائص هذا 
الأاسلوب هو ان يكون الباحث ذا معرفة بالعنوان او المسار الصحيح qu‏ مع 
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مراعاة كل العلامات والفواصل وتغير أشكال الحروف «small or capital letters‏ إذ أن 
خطأ بسيطا في أي حرف من حروف المسار قد تؤدي به إلى موقع آخر أو إلى 
صفحة النتائج غير الصحيحة التي تشير إلى عدم وجود هذا المسار. فعلى 
المستفيد حفظ مسارات مواقع الإنترنت بشكل صحيح وكتابتها بدقة. 
1/1/١‏ استخدام برامج تصفح !4 4< Web Browsers‏ 

تحتاج صفحات ومواقع الويب بطبيعتها إلى بيئات خاصة تتيح لها أن تعمل 
وتسمى هذه البرامج بمتصفحات الإنترنت. ويقصد بها البرامج الخاصة لعرض 
صفحات ووثائق الإنترنت. أو تلك البرامج التي تعمل في ais‏ الإنترانيت Intranet‏ 
وهي تقنية الربط باستخدام شبكة الإنترنت. ويوجد الكثير من برامج تصفح الويب 
المستخدمة حاليا« منها المستكشف «Internet Explorer‏ ونيتسكيب «Netscape Navigator‏ 
وأو برا Opera‏ وموزايك .NCSA Mosaic‏ 

sary‏ البرنامجان الأول والثاني الأكثر استخدامًا بين المستفيدين في 
المجموعة السابقة. أما الأول فأنتجته شركة مايكروسوفت Microsoft‏ وقد خرج لهذا 
البرنامج إصدارات متعددة بدأت مع إنتاج نظام التشغيل .windows9s‏ وكان آخرها 
.Internet Explorer ver.6‏ اما البرنامج الثاني وهو Netscape Navigator‏ فأنتجته شركة 
Netscape‏ وكانت آخر إصداراته هي 8.1 Netscape‏ وتستعد الشركات المنتجة لهذين 
البرنامجين لاخراج الإصدارات القابلة للاستخدام بالصوت -speech-enabled browsers‏ 

وتعتمد برامج التصفح على جانبين فقط في الاستخدام؛ الأول في عرض 
صفحات ومواقع الويب. وهو الجانب الأكثر استخدامًا Li‏ لطبيعة تلك البرامج؛ 
حيث لا تخصص قدرات لبحث صفحات الويب سوى استخدام فراغ العنوان وهو 
الجانب الثاني لاستخدام المتصفحات والذي يعتمد بصفة أساسية على معرفة 
عنوان صفحة الويب URL‏ مسبقًا. وتتيح المتصفحات من خلال واجهاتها التنقل بين 
روابط الصفحات المختلفة بحيث يمكن التحرك من صفحة إلى أخرى؛ إلا أن هذا 
يعتمد بطبيعته على وجود رابط الصفحة التي سيتم الانتقال إليها. وهو ما يعد 
Las‏ كبيرًا في البحث باستخدام المتصفحات. وفي حالة استرجاع المادة 
المصورة تبعًا لهذا الأسلوب فإنه من اللازم توافر لقطات المادة المصورة أو 
وحدات Ano!‏ للوصول إلى روابط وحدات المادة المصورة الرقمية في الإطار 
الأصلي لها. 
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News Groups استخدام مجموعات الأخبار على الويب‎ ١ 

يعتمد استرجاع المعلومات هنا على استقبال رسائل البريد الإلكتروني 
والتي تقدم المعلومات الجارية لما يخص الموضوع المحدد؛ حيث تحيط هذه 
الرسائل الباحثين بالمقالات حديثة النشر أو ما تم نشرها بين أعضاء المجموعة. 
ويذكر T. Matthew Ciolek‏ أن مجموعات الأخبار قد سارت على نسق خدمات البريد 
الإلكتروني ومجموعات الدردشة في نمو المجتمعات الإلكترونية. وتستقطب 
مجموعات الأخبار المستفيدين الذين يشتركون في السمات العلمية والبحثية. 
وتتعدد الأنشطة داخل هذه المجتمعات من تبادل الآراء والتراسل ونشر الأبحاث 
الخايكة TOTE‏ 


وتحتوي مجموعات الأخبار بدورها على قواعد بيانات يمكن للباحثين 
إجراء البحث بها واسترجاع التقارير أو المقالات السابق تخزينها على قاعدة 
بيانات. ويتطابق البحث داخل alad‏ البيانات مجموعات الأخبار مع قواعد 
البيانات الأخرى على الويب» ويخضع البحث بدوره إلى أساليب بحث محددة 
لقاعدة البيانات. غير أن محتوى تلك القواعد يتوقف على ما تضمه مجموعة 
الأخبار في هذا الموضوع. 
١‏ بحث قواعد البيانات المعلومات غير “Aud pol!‏ 

تعتبر قواعد البيانات على الويب الجزء غير المرئي أو الخفي من الويب» 
وتأخن قواعد البيانات مصطلحات مختلفة مثل Invisible Web‏ أو Hidden Web‏ أو Deep‏ 
web‏ وقد أخذت قواعد البيانات تلك المصطلحات لاختفاء مصادر معلوماتها عن 
التقنيات التي تستخدم في البحث على صفحات الويب المرئية. مما يعني عدم 
إمكانية الوصول إليها وتكشيفها. فبينما استرجاع المعلومات على الويب المرئية يتم 
من خلال محركات البحث التي يستخدم فيها برنامج يسمى «Crawl casi‏ يكم 
استرجاع المعلومات داخل قواعد البيانات caa‏ غير EETRI‏ بالوصول المباشر 
إلى صفحة الموقع الذي يحوي قاعدة البيانات ثم البحث داخلها. 


Ciolek, T. Mat:thew. Internet Structure and Development: On Strat:egic Uses of the (*) 
Archetypes of the Networked Mind, author, 1999, Visited at: 10/10/2003;,: 
http://www.ciolek.com/PAPERS/pnc-taipei-99.htm 
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ولقد ذكر Paul Pedley‏ أن مصطلح الويب غير المرئية يمكن أن ينطوي على 


أربعة مستويات من اختفاء مصادر قواعد البيانات. وقد حدد هذه المستويات 


اعتمادًا على درجة الوصول إلى قاعدة البيانات. وهي كما يلي 


zy 


١‏ الويب غير الشفافة 


وهي تشمل فواعد البيانات كبيرة الحجم على الويب» التي تتكون بدورها من 


مجموعات كبيرة من مواد المعلومات. وعلى الرغم من ملاءمة هذه المواد لعمل 
برنامج الزاحف وإمكانية اقتنائها داخل قواعد محركات البحث؛ إلا أن برامج 
الزاحف لا تستطيع الوصول إليها ويرجع Paul Pedley‏ هذا إلى عوامل مختلفة منها:- 


O) 


عمق الزحف: تعمل محركات البحث على زيادة عمق التحليل والبحث لبرامج 
الزاحف لتحقيق أفضل أشكال الاقتناء. خاصة في الوقت الذي تتزايد فيه 
أعداد صفحات مواقع الويب بشكل مستمر. وتعمق برنامج الزاحف داخل موقع 
الويب وتحليل كامل صفحاته لأجل جمعها من شأنه رفع تكاليف العمل داخل 
محركات البحث. وتتجنب محركات البحث إظهار مدى العمق الذي تعمل به 
برامج الزحف داخل صفحات الويب. 

تأخر التحديث الدوري: فإضافة صفحة جديدة إلى محرك البحث يحتاج إلى 
وقت قد يصل إلى شهر أو أكثر حتى يتم تمييزه ببرنامج الزاحف» وعلى 
الجانب الآخر فإن الرجوع إلى مواقع سابقة للبحث عن التحديثات الأخيرة بها 
من صفحات مضافة يحتاج إلى وقت أطول من الوقت الذي يستغرقه التحديث. 
وعلى ذلك فإن lija‏ من مواد المعلومات المحدثة داخل مواقع الويب التي تم 
إضافتها مسبقًا سيظل بعيدًا عن أيدي الباحثين فترة من الوقت. وهو ما 
يحدث في النوع الحالي من فواعد البيانات. 

ازدياد النتائج المستدعأة :Maximum Number of Viewable Results‏ تتسم محركات 
البحث بكبر حجم قواعد بياناتهاء ويتضح ذلك في أعداد النتائج المسترجعة 
داخل فاعدة البيانات التي قد يصل عددها إلى ملايين الصفحات. مما يعني 
معه أن محركات البحث تعمل على الإهمال المتعمد لاستبعاد النتائج الأقل 


Pedley, Paul. The Invisible Web, The Library Associat:ion, 2000, Visited at: 
20/10/2003,: http://www.la-hq.org.uk/directory/record/r20001 1/article2.html 
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علاقة بالنسبة لكلمات البحث ومثل هذه النتائج تظل دائما الجزء غير المرئي 
أمام الباحثين. 
زيادة الروابط غير النشطة: وهذا بدوره لا يرجع إلى عمل محرك البحث وإنما 
خطأ في تفعيل روابط بعض الصفحات التي لا يستطيع برنامج الزاحف 
الوصول إليها سوى باستخدام مسار الصفحة URL‏ أو الإضافة المادية عن 
طريق مصممي صفحات الويب. 
١‏ الويب الخاصة 
وهي تتكون من مجموعة من صفحات الويب القابلة للتكشيف بواسطة 
برنامج الزاحف. غير أنها تستخدم حالة من حالات ثلاث تالية لمنع دخول برنامج 
الزاحف إليها. وهذه الحالات هي:- 
استخدام كلمات المرور للتعرف إلى محتوى الصفحة. 
تهيئة ملف robots.txt‏ المحدد لعمل برنامج الزاحف لمتع التعامل مع صفحة 
الويب. 
استخدام حقل noindex metatag‏ للتوقف عن إضافة هذه الصفحة. 


70١‏ الويب ذات الملكية 

ويقصد بهذا النوع مجموعة فواعد البيانات التي تتوفف على وجود حساب 
أو ربط Registration‏ مع موقع القاعدة. وعلى الرغم من أن هذا النوع يقدم خدمات 
مجانية. فضلا عن سهولة alas!‏ عملية الربط بالقاعدة؛ إلا أن أفضل برامج 
0١‏ الويب غير المرئية 

ويعد هذا الجزء من الويب هو الواقع الفعلي لمفهوم الويب غير المرئية. 
ويمكن لأي جزء من صفحات الويب أن ينجلي أمام الباحثين إذا ما امتدت إليه 
برامج محركات البحث لتكشيفه وإخضاعه للبحث abel‏ المستفيدين. ويختلف الجزء 
الحالي من الويب في البناء الفني عن الشكل المستخدم Gal‏ برامج الزاحف فلا 
يستطيع برنامج الزاحف استخدام محتوى تلك الصفحات. ويشير Paul Pedley‏ إلى أن 
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ذلك يتوقف على احتواء صفحات الويب على أنواع من الملفات لا تتعامل معها 
محركات البحث fis‏ الملفات المضغوطة وملفات pdf‏ وملفات الفلاش Flash‏ ولا 
يكفي الجزء البسيط من حقول الميتاداتا المصاحب لهذه الملفات في إعانة برامج 
الزاحف على تحليلها وتكشيفها التي تحتاج إلى التعامل مع كامل المتن لصفحة 
الويب في تكشيفها وبحثها. 


0١‏ تصفح أحد أدلة البحث على الويب 


يطلق على هذا النوع من أدوات البحث مسميات عدة مثل subject guides‏ 
internet resource guides, internet directories, internet indices, internet catalogs‏ وكلها 
تعطي معنى القوائم أو الموضوعات المقسمة. وتعتمد أدلة البحث على تقسيم 
المعرفة أو العلوم إلى أقسام عامة ثم إلى أقسام أكثر تخصصًا أو قوائم فرعية. 
ومن ثم يمكن الحصول على الموضوع ومن ثم المواقع التي ترتبط مباشرة بهذا 
الموضوع المخصص. وقد تعددت الأدلة على الويب ولكن يمكن تقسيمها إلى الفئات 
التالية:- 


.١‏ أدلة بحث موضوعية: وهي تلك التي تعتمد على التقسيمات العلمية للموضوعات 
وهي بدورها تنقسم إلى نوعين: أدلة البحث العامة. وأدلة البحث المتخصصة؛ 
والعامة هي التي تغطي مجالات المعرفة كافة. وهي قد لا تعتمد على تقسيم 
موضوعي محدد وإنما تعتمد على تقسيم عام لكل المعرفة وقد يتضمن هذا 
التقسيم موضوعات خاصة بالأسرة أو الرحلات أو الترفيه. أو قد تعتمد على 
خطة تصنيف Arolle‏ أو خطة تصنيف Agag‏ أو متخصصة. Lal‏ أدلة البحث 
الموضوعية المتخصصة فقد تفطي موضوعات متخصصة مثل مجال 
المكتبات. أو الطب Wie‏ 


LY‏ أدلة بحث نوعية: وهي تلك التي تقصد فنّة معينة من المستفيدين مثل أدلة 
مواقع الأطفال أو المسنين. أو ذوي الاحتياجات الخاصة. أو المرأة أو غيرها 


وهي بدورها فد تعتمد على خطة تصنيف Arolle‏ أو متخصصة. 


.٣‏ أدلة بحث جغرافية: وهي تلك التي تعتمد على تغطية المواقع التي تنتمي إلى 


دولة معينة أو منطقة جغرافية تتحدث aa‏ واحدة. 
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وتعد الهيئات التجارية هي أغلب الهيئات التي تعمل على وضع أدلة البحث 
بجميع أنواعها وذلك بهدف وضع الإعلانات. حيث إنها الأكثر زيارة واستخدامًا على 
الويب. 
ولقد وضع Paul Pedley‏ مجموعة من العناصر التي يتم عندها الاستعانة بأدلة 
البحث» إذا ما أراد الباحث الحصول على معلومات قيمة في مجاله وهي :- 
.١‏ عندما تكون هناك فكرة أو موضوع واضح في ذهن الباحث. 
Y‏ عندما يريد الباحث حصرًا بالمواقع في موضوع واحد. 
Y‏ عندما يريد الباحث الحصول على قائمة بالمواقع التي تخص موضوهعًا 
مخصصًا Y‏ يتخللها شوشرة من المواقع التي لا تتصل بالموضوع. 
؛. عندما يريد الباحث الحصول على عناوين أو كلمات مفتاحية بفض النظر عن 
الحصول على مواقع أو مصادر تتصل بالموضوع. 
0. عندما يريد الباحث تجنب عرض تلك الصفحات التي تحتوي على محتوى 
قليل عن الموضوع. والتي Lille‏ ما تكون ضمن نتائج محركات البحث. 
0١‏ الاتجاه إلى أحد محركات البحث 


تعمل محركات البحث بالاعتماد على برنامج يطلق عليه الزاحف أو الديدان 
أو العنكبوت أو الإنسان الآليءوهو البرنامج الذي يسبح في فضاء الويب ويتعرف إلى 
المواقع المختلفة لتحديد ماهية هذه المواقع ثم ضمها إلى قاعدة بيانات أداة 
البحث المنتمي لها البرنامج. ويأخذ الزاحف أو العنكبوت طريقه اعتمادًا على 
تزويده بآليات لاكتشاف صفحات الويب» متخدًا من بنية ملفات الويب المكتوبة ب 
htmi‏ أداة لتحليل الصفحات وتكوين الروابط الموصلة لها فيما بعد. ويبدأ برنامج 
الزاحف عمله في مسح فضاء صفحات الويب اعتمادًا على إستراتيجيات تحرك 
مختلفة؛ أولها يتمثل في الاعتماد على قائمة لمجموعات من المواقع مرتبة زمنيا 
داخل خادم أو أكثر من خادمات الويب وتعرف بقائمة الحديث على الويب ؛ أما 
الشكل الثاني فهو الاعتماد على قائمة موضوعة يدويًا من مصممي صفحات الويب 
بأهم المواقع التي يمكن أن ينطلق منها برنامج الزاحف. والشكل الثالث هو 
الاعتماد على قوائم مجموعات المناقشة أو الأخبار في المواقع التي تضمها لتزويد 
البرنامج بها. 


ويرى Paul Pedley‏ أنه على الرغم من وجود فارق كبير بين محركات البحث 
والأدلة البحثية في عناصر عدة مثل البحث الخارجي وترتيب النتائج والبحث في 
قواعد البيانات وغيرها؛ إلا أن الباحثين عن المعلومات لا يكادون يرون ذلك الفارق 
في عمليات البحث؛ حيث يلجأ المستخدم إلى أداة بحث بغض النظر عن ماهية 
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.١‏ أن الاختلافات في تنظيم المعرفة ومصادر المعلومات الإلكترونية من صفحات 
ومواقع الويب هو أمر لا يتم أمام مستخدمي الإنترنت. 
Y‏ أن الكثير من أدلة البحث الجيدة Wahoo fie‏ لا يستخدم بكثرة من قبل 
الباحثين. نظرًا لعدم تفحص المستخدم لمثل هذه الأدلة. 
؟. أن محتوى الويب من مصادر المعلومات يتزايد بمعدل مرتفع. مما يجعل 
الباحث Leb‏ لاأدوات بحث مختلفة. 
ut‏ أن كل من محركات البحث وأدلة البحث يكمل بعضها الآخر في عملية البحث 
العلمي. 
0. أن الاختلافات بين محركات البحث والأدلة البحثية إنما هي اختلافات ضبابية 
Y‏ تضح معالمها طالما وجد بحث ونتائج يمكن الخروج بها. 
ولقد كان نتيجة صغر الفروقات بين خصائص محركات البحث والأدلة 
البحثية أن اتجهت بعض المواقع إلى الجمع بين النوعين أي الجمع بين صفة 
محركات البحث وبين الخصائص المميزة لأدلة البحث وهو ما سيطلق عليه في 
هذه الدراسة مسمى أدوات البحث . وقيما يلي سيتم تناول أدوات البحث 
بالتفصيل. 
١‏ أدوات البحث على الويب 
إن الأهمية التى تأخذها هذه الأدوات تأتى من الدور الذى تؤديه فى الويب 
افاس يميا يونت ات الوميوق إلى sce pe e‏ يك cas‏ هد 
الأدوات عمل اختصاصى المعلومات فى اقتناء وسائط المعلومات فى مختلف 
المجالات ثم تنظيمها bandes‏ الإعداد E‏ لوضعها قيد الاسترجاع E‏ أي وقت 


ibid. )1( 
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لمختلف الباحثين وكل حسب حاجته الموضوعية. ولولا هذه الأدوات لأصبحت الويب 

مستودعا يحمل بداخله معلومات العالم أجمع في شكل غير منظم وعشوائي لا يوفر 

أي وسيلة للبحث سوى مسار أو lgie‏ الموقع URL‏ مما ينعكس على المستفيد 

كالذي يبحث عن ضالة في فلاة. 

وبذلك يمكن تحديد أهمية وجود أدوات بحث الويب في سببين هما:- 

.١‏ أن كم المعلومات على الإنترنت ينمو بالسرعة والحجم الذي لا يمكن لمستخدم 
ما معرفة ما هي المواقع التي تهمه وأين توجد؟ 

Y‏ أن الأغلبية من المستخدمين للويب حتى الماهرين منهم لا يستطيعون الوصول 
في عمليات البحث إلى مستوى الدفة المناسب والتحكم في عمليات الاستدعاء 
ذلك لانه يبحث عن شيء غير محدد امامه. 

0١‏ كيفية عمل أدوات البحث 

تعمل أدوات البحث في الويب بشكل يشبه LG‏ طريقة العمل في مكتبة 
تقليدية. من حيث الإضافة والتزويد. والإعداد الفني والتنظيم» والبحث gle puss‏ 

ويمكن تمثيل تلك العمليات كما يلي :- 

أولا: الإضافة والتزويد 

تختلف الأدلة البحثية عن محركات البحث في الإضافة والتزويد. فالأولى 
تعتمد على القوى ia nal‏ والثانية تعتمد على البرامج الآلية. فالأدلة البحثية 
تستخدم الأفراد في مرحلة الإضافة والتزويد عن طريق تصفح الإنترنت ثم تجميع 
المواقع التي وفع عليها الاختيار. وفهرستها وتكشيفها لتوضع ضمن فاعدة بيانات 
sl‏ أما محركات البحث فتعتمد على برنامج الزاحف أو العنكبوت. وهذا يعني 
أن حجم التفطية في الأدلة البحثية ليست بالقدر الكافي لمواقع الويب المتنامية 
العدد. فالأدلة تعمل من منظور الأعداد القليلة التي يمكن التحكم فيها وإعدادها 
بما يحقق للباحث أكبر قدر من الدقة والتحقيق.. بينما تعمل محركات البحث على 

تغطية واسعة للمواقع على الويب. 

ومن ناحية asd!‏ فإن التزويد والإضافة للأدلة البحثية يكون عن طريق 
الطلبات التي تقدم من أصحاب المواقع pes‏ سواء كانت تجارية أو حكومية أو 
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محركات البحث فيكونان عن طريق الزاحف الذي يتحرك بين روابط الصفحات 
المختلفة ومن ثم تحليل كل الروابط داخل صفحات الموقع المجدد ثم زيارة هذه 
الروابط؛ إلا أن برامج الزاحف تختلف فيما بينها من حيث مستويات تحليل 
صفحات المواقع؛ حيث تكتفي بعض البرامج بالمستويين الأول والثاني لصفحات 
موقع الويب. وتتعدى بعض برامج الزاحف ذلك إلى المستويات الثالث والرابع. وهو 
ما يؤثر بشكل أساس على أعداد صفحات الإضافة اليومية لبرنامج الزاحف. وهذا 
يترتب عليه فترة التحديث التي قد تتأخر بعض الشيء. فالتزويد في محركات 
البحث يتم في فترات متقاربة كل ساعة أو كل age‏ وقد يكون في فترات متباعدة 
أسبوعيًا أو شهريًا؛ إلا أنه يمكن اعتبار هذه الفترات دورة يتم فيها الزاحف العمل 
إلى العودة مرة أخرى لمثل هذه المواقع لتبيان ما بها من تحديث. أو تفيرات في 
متن هذه الصفحات. 


ثانيًا: الإعداد الفني والتنظيم 

بعد أن تنتهي المرحلة الأولى بإضافة نسخة من موقع الويب إلى قاعدة 
بيانات محرك البحث. يبدأ عمل الجزء أو البرنامج الثاني في أدوات البحث الذي 
يعرف بالمكشف أو المفهرس. حيث يقوم بإعداد تسجيلات ببليوجرافية لمواقع 
الويب حديثة الإضافة إلى قاعدة بيانات lal‏ البحث. وتعمل هذه التسجيلة Laag‏ لما 
ورد في المكتبات والمعلومات عن (التمثيل المكثف) حيث لا يتم اختزان موقع الويب 
باكمله في عدد من ادوات البحث. وإنما حقول وبيانات منها مسار هذا الموقع 
للربط به والوصول إليه. وكل ذلك في شكل تسجيلة كما هو الحال في الفهارس 
الآلية للمكتبات OPAC‏ وتتم عملية الفهرسة في حالة الأدلة البحثية بشكل يدوي. Lal‏ 
في حالة محركات البحث فإنها تتم Ll‏ وفي حالة التكشيف والفهرسة الآلية فإن 
برامج التكشيف الآلي تستخدم بنية صفحة الويب في التعرف إليها ووضع كلمات أو 
مصطلحات معبرة عن الموضوع أو الموضوعات التي تضمها صفحة الويب؛ حيث 
يفحص البرنامج هنا كل أجزاء الصفحة التي تحتوي على كلمات تخص الموضوع 
من كلمات العنوانء وكلمات النص. والكلمات المفتاحية التي وضعها مصمم صفحة 
الويب في رموز metatags‏ وتجمع هذه الرموز كل الكلمات التي يرى مصمم الصفحة 
أنها تعبر عن موضوع أو موضوعات صفحة الويب. وبعد تفحص كل الجوانب 
السابقة يتم وضع كلمات مفتاحية داخل تسجيلة هذا الموقع او وضع كل كلمات 
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النص الطبيعية في وضع نشط ليتم مضاهاتها بعد ذلك مع كلمات البحث التي 
يضعها الباحث عند إجراء البحث. وتختلف مواضع التكشيف من برنامج إلى 592 
حيث تعمل بعض برامج التكشيف على الاكتفاء بالجزء الأول فقط من بنية اللغة 
المفيازية Aaa!‏ الوت La‏ تل يمظن ارامح على SS‏ عتاوين الفاق 
بجانب مسار الصفحة, وتمتد قدرة برامج التكشيف في أحيان أخرى إلى تكشيف 
كامل متن صفحة الويب وهو ما يجعل محركات البحث في هذه الحالة تمتاز بوفرة 
في الاستدعاء مع انخفاض نسبة التحقيق. ويبين الشكل رقم )١-١(‏ طريقة 
برنامج المكشف في دائرة عمل محرك البحث: 


اختزان | البحث فم, الكشاف 


الوصول إلى صفحات الويب 


الشكل رقم )1-1( يوضح عمل برنامج المكشف في دائرة عمل محرك البحث 


ثالثا البحث والاسترجاع 

يعد الاستدعاء من eal‏ مقاييس كفاية النظام. لكن الأمر لا يقتصر على 
النظر إلى النتائج. بل يتعدى إلى ماهية التنظيم داخل نظام الاسترجاع؛ فمحركات 
البحث تعتمد على البحث الحر في كامل نص الموفع مع إمكانية البحث في العنوان 
والرموز المعيارية (metatags)‏ وبذلك فإن الاستدعاء سوف يكون في أعلى درجاته.. 
بينما يكون التحقيق في أقل حالاته. ذلك لأن آلية التكشيف التي تعتمد عليها 
محركات البحث هي استخدام اللغة الطبيعية وهذا إنما يعكس بدرجة عالية أن كل 
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كلمات النص سوف تصبح كلمات مفتاحية يمكن من خلالها استدعاء الوثيقة 
(موقع الويب) اعتمادًا على مضاهاة الكلمات البحثية. أما الأدلة البحثية فإنها 
تعتمد في البحث على كلمات كشفية ومصطلحات يتم وضعها بالتدخل البشري تعبر 
بصدق عن الموضوع. وبالتالي فإنه يستبعد أية وثائق أو مواقع غير ذات Abie‏ ويولد 
تحقيقًا Whe‏ مع استدعاء منخفض . 


ومن ناحية أخرى تكون النتائج في محركات البحث مرتبة حسب أهمية 
الموقع للموضوع. ويختلف الوزن النسبي لموقع الويب وتقدير أهميته للموضوع إما 
اعتمادًا على عدد تكرار الكلمات المفتاحية التي ذكرت في السؤال؛ أو أماكن تواجد 
الكلمات المفتاحية والموقع بحيث إذا ما وردت في العنوان يكون للموقع أهمية أكثر 
من وجودها في النص نفسه. وبحسب الأهمية يأتي ترتيب النتائج بالموقع فالأكثر 
أهمية للموضوع يأخذ الرقم )١(‏ في الترتيب ثم ما يليه من المواقع على حسب 
هذا الوزن ... وهكذا. أما بالنسبة للأدلة duis!‏ فإنه dale‏ ما تحدد هذه الأهمية 
من قبل المفهرس نفسه الذي يحدد موضع الموفع في الترتيب. 

وفي كلتا الحالتين. فإن البحث والاسترجاع يعتمدان على إستراتيجيات 
تستخدم معاملات المنطق البولينيء وآلية بحث اللغة الطبيعية. والبحث BLL‏ 
والبحث بالمفهوم» والبحث بالتقارب بين الكلمات «near, next‏ والبحث بالمتضادات. 
والبحث بالترجمة... وغيرها الكثير من معاملات وآليات بحث تعمل جميعا لأداء 
أفضل تحقيق للباحث عن المعلومات وسيأتي ذكرها بالتفصيل. 
0١‏ إستراتيجيات البحث في أدوات البحث 

إن من أهم المصطلحات التي تذكر بذكر محركات البحث هو مصطلح 
إستراتيجيات البحث. ويمثل هذا المصطلح أهمية كبيرة في فهم محركات البحث 
ذلك؛ لأنها تمثل أحد الأعمدة الثلاثة التي يقوم عليها محرك البحث؛ الإضافة 
والتكشيف والبحث. وقد ذكر Paul Pedley‏ أن إستراتيجيات البحث تقوم على خمسة 


عناصر أساسية هي(" 


.١‏ أن يتم صياغة أسئلة البحث الصياغة التي تحدد الهدف من طرح السؤال. 


V. aS‏ د 


Y‏ أن تحدد المفاهيم المهمة من كل كلمات السؤال المطروح. 

.٣‏ أن تحدد مصطلحات أو كلمات البحث التي تصف تلك المفاهيم. 

at‏ أن تحدد المترادفات المختلفة التي تعبر عن نفس الموضوع والمفاهيم 
المطلوية. 

0. أن ينشأ منطق بحث يمكن استخدامه من جانب الباحثين. 


هذا عن الأساس الذي تسير عليه إستراتيجيات البحث؛ في أدوات البحث. 
إلا أن التطبيق والتنوع في إستراتيجيات البحث هو الواقع القائم بالفعل داخل تلك 
الأدوات. ونظرًا لأن جميع محركات البحث تسعى للزيارة الدائمة من جانب 
المستخدمين» فإن هذه المحركات لا تدخر جهدًا في تحسين إستراتيجياتها وتقوية 
نظم الاسترجاع لديها. وتضم إستراتيجيات البحث أنواعا عدة. ولقد ضمت دراسة 
calix Anne Clyde‏ إستراتيجيات البحث المستخدمة داخل محركات البحث. ويمكن 


تناول هذه الإستراتيجيات كما S; ok‏ 


.١‏ النوع الأول: إستراتيجيات بحث اللغة الطبيعية وهنا تتيح محركات البحث 
استخدام لغة الحوار الطبيعي من جانب المستخدم» حيث لا يتوقف الأمر على 
إدخال كلمات مفتاحيه. وتعمل بعض المحركات AskJeeves fis‏ على أن تناسب 
فئات الأطفال بجانب كبار السن. وعلى ذلك فإن محركات البحث لا تألو جهدًا 
في جعل البحث أكثر يسرًا على الباحث وفي الوقت ذاته تجعل التحقيق أكثر 
495 في النتائج. 

۲. النوع الثاني : معاملات المتطق البوليني Boolean Operators‏ وتعمل هذه 
المعاملات على ربط الكلمات المفتاحية Las‏ مكونة حدودًا موضوعية ترسم 
شكل الموضوع النهائي. وتستخدم المعاملات؛ AND‏ للجمع. NOT‏ للاستشاءء OR‏ 
للبدائل. 

". النوع الثالث : استخدام البحث الحر : ويشتمل هذا النوع على ما يجعل الباحث 
يتفادى الخطأ في الإملاء. مما يؤثر بدوره على مصطلحات البحث. كما أنه 
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يجعل محركات البحث تستخدم كل الأشكال المختلفة للكلمة الواحدة مثل إدارة 
تسترجع إدارةء إداري» إداريون. إدارات... الخ من الأشكال الأخرى. 

النوع الرابع : إستراتيجيات بحث المفرد والجمع : وهذا النوع من إستراتيجيات 
البحث يعمل على استرجاع المفردات بأشكالها المختلفة من مفرد وجمع» وعلى 
ذلك فإن كلمة طفل تسترجع أطفال . وكلمة مكتبة تسترجع مكتبات. 

النوع الخامس : إستراتيجية البحث بالقرب. وهذا النوع له معاملاته الخاصة 
في صياغة إستراتيجية البحث fie‏ مقترن adjacenta‏ قريب nears]‏ متبوع ب 
allowed by‏ ويتحكم بذلك الباحث في الجمع بين مصطلحين من مصطلحات 
البحث ليخرج الموضوع على الشكل الذي يرتضيه. 

النوع السادس : إستراتيجية البحث بحساسية الحالة : التي يتم فيها البحث 
عن pies‏ المصطلح إذا وجد على شكل معينء فتكون Earth‏ هي الكوكب اما 
earth‏ ذهي التربة. ومن المحركات التي تتح هذا اانوع. ومڈال آخر Sum MS‏ 
بالأسجاء Riyal!‏ اة Vand‏ هبه - هبة. على - علي» أحمد - 


احمد 


النوع السايع : إستراتيجية البحث بالعبارات : ويعمل هذا النوع على جمع 
مصطلحين أو أكثر aia‏ عن الموضوع. ولا تضل ella‏ هنا إلى das:‏ أو 
أسئلة. والعبارات البحثية تكون مثل النظام الشمسي. مكتبات المدارس . 
النوع الثامن : إستراتيجية البحث بالحقول ويتم البحث في حقول التسجيلة 
الواصفة لوسيط المعلومات: موقع أو صفحة الويب» كأن يتم Gap‏ في Ja‏ 
العنوان مثل trsisiam‏ حيث t:‏ هي Jam‏ العنوان title‏ أيضا Em‏ للعنوان. مو 
للمؤلف. 

النوع التاسع : إستراتيجية النتائج الأوليةء ويقوم هذا النوع من البحث على 
عرض النتائج الأولية للبحث. ثم يحدد الباحث العناوين الأكثر قربا للموضوع. 
ويأتي دور محرك البحث في استرجاع كل النتائج المشابهة لما اختاره الباحث 
وقد calle!‏ عليها -(more like this Clyde)‏ 


ويرى الباحث أنه يجب أولا الوقوف على الفارق بين مصطلحات إستراتيجية 


البحث وآلية البحث؛ ذلك لما بينهما من تداخل ؛ حيث يمكن النظر إلى إستراتيجية 
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البحث على أنها الشكل النهائي لصياغة كلمات البحث والربط بينها بآليات البحث. 
وهي بمثابة الحصيلة النهائية من الكلمات وأدوات الربط التي تدخل إلى قاعدة 
بيانات نظام الاسترجاع. أما آليات البحث فهي الأشكال المختلفة من أساليب بحث 
نظم الاسترجاع؛ حيث تتيح بعضها استخدام آلية المنطق البوليني بمختلف 
di eles‏ ويتيح البعض الآخر استخدام الحقول أو استخدام RUE‏ البحث بالبتر 
الضمني بمعاملاته المختلفة. وعلى ذلك فإن الأنواع السابقة من إستراتيجية البحث 
التي ذكرت في دراسة Clyde‏ قد شملت بداخلها نماذج عدة من آليات البحث مدخلة 
عليها مفاهيم إستراتيجيات البحث. 


وتقسم عناصر البحث داخل نظم الاسترجاع من الأعم إلى الأخص كما 
يلي؛ أولا: إستراتيجيات البحث وتضم الشكل النهائي المدخل إلى قاعدة البيانات, 
ثانيًا: آليات البحث وهي أساليب لبحث وحدات قواعد البيانات مثل المنطق البوليني 
eel acd esl‏ بالعشوق: Cee G‏ وهب us all‏ المتكونة 
لأليات البحث مثل معاملات and, or, not‏ لتكوين الية المنطق EUM‏ ومعاملات ?,* 
آلية البتر الضمني ومعاملات ti, su, au‏ المكونة لآلية البحث بالحقول. 

وقد اختلطت الأنواع التي ذكرتها Clyde‏ من إستراتيجيات البحث فضمت 
بينها أنواعًا من آليات البحث والتي تختلف بدورها عن مفهوم إستراتيجية البحث. 
ذات المفهوم الأعم عن الآليات؛ فإذا ما أخذ البحث بالحقول مسمى إستراتيجية 
البحث. يأخذ المنطق البوليني والربط مختلف العلاقات بين الحقول مسمى آلية 
البحث. ومن ثم فإن مستويات بحث نظم استرجاع المعلومات يحتاج إلى نظم بحث 
تتكون من إستراتيجيات بحث مثل البحث بالكلمات الحرة أو الكلمات المقيدة, 
وتحتوي إستراتيجيات البحث بدورها على آليات بحث مثل المنطق البوليني أو 
البحث بالتقارب» ولا تقوم هذه الآليات بعملها إلا من خلال معاملات البحث مثل Or,‏ 
0 داخل المنطق البوليني. 

إضافة إلى ما سبق يمكن إضافة أنواع أخرى من إستراتيجيات البحث مثل 
البحث caggactl‏ وهو ما يطلق عليه «Concept-based searching‏ ولقد برز هذا النوع 
نتيجة لما يواجهه البحث بالكلمات المفتاحية من صعوبات وأهمها الاشتراك اللفظي 
بين الكلمات في حالة البحث إذا ما استخدمت كلمة مفتاحيه واحدة في البحث؛ 
فإن استخدام كلمة واحدة في البحث مثل قلب في اللغة العربية أو "Heart"‏ في 
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اللغة الإنجليزية للبحث عن موضوع القلب من الناحية الطبيةء ينتج عنه الكثير من 
النتائج التي تبتعد عن الموضوع مثل الإصايات التي تتجه صوب كلمة القلب في 
الرومانسية. 

وتعمل الكثير من محركات البحث الآن على الإنترنت مثل Excite‏ على 
استخدام البحث بالمفهوم. ولعله من gall alal‏ أن استخدام المفهوم لا يكون فقط 
في مرحلة البحث وإنما في مرحلة التكشيف بالتعيين؛ الذي يعتمد في مجمله على 
كلمات تعبر عن مفاهيم يتم استخدامها لتمثيل الوثيقة "E‏ مصدر المعلومات. وقد 
ذكرت Linda Barlow‏ أن البحث بالمفهوم يختلف عن البحث بالكلمات في الاهتمام 
بما تعبر dic‏ الوثيقة Aboutness‏ وليس بما تحويه الوثيقة من كلمات واسترجاعها 
باستخدام منطق المضاهاة. وتسترسل Barlow‏ في الحديث عن عمل البحث 
بالمفاهيم ob‏ ذلك Sh‏ بالاعتماد على وجود مجموعة من SLASH‏ التي تعبر 
مجتمعة عن موضوع واحد أو جانب من موضوع عام وذلك كما في المثال «QUU.‏ 
فإذا ما وجدت كلمة "heart"‏ بجانب كلمات أخرى مثل "blood, cholesterol, attack, lung‏ 
and stroke"‏ فإن هذا يدل على تناول القلب من الناحية الطبية؛ أو الموضوع الفرعي 
القلب من مجال الطب. أما في حالة أن تأتي كلمة "heart"‏ وسط مجموعة من 
الكلمات مثل "love, valentine, flowers, candy"‏ فإن ذلك يعني أن الوثيقة تتناول القلب 
في إطار الحديث عن الرومانسية. مما يترتب على كل حالة من الحالتين السابقتين 
إبعاد مجموعات المصادر التي لا ترتبط بالموضوع المراد البحث عنه. وقد ME‏ 
Barlow‏ في دراستها أن مثل هذه النظم التي تعمل بالمفهوم لا تتعدى كفايتها إلى 
الناحية العملية. إنما هي فقط نظم مثالية من الناحية Tm‏ 


/١‏ محركات البحث 


إن الكم المعلوماتي الذي تحمله الويب لا يمكن الاستفادة منه؛ إلا عن طريق 
التنظيم والإعداد. وتعد محركات البحث مرشد الباحث ودليله في الوصول إلى 
المعلومات على الويب. وتهتمد محركات البحث على برامج وإن تبدو أمام الباحثين 
سهلة؛ إلا أنها دقيقة في أدائها. ذلك لأنها تجمع المعلومات من مواقعها ثم تنظمها 


Barlow, Linda. A Helpful Guide to Web Search Engines, Monash Informat:ion (*) 
Services, 2002, 11/112002, Visited at: http://www.monash.com/spidap.html 
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بعمليات الفهرسة والتكشيف وتتيح بعد ذلك آليات للبحث داخل قواعد بياناتها 
لتعطي بعد ذلك ثمرة هذا الأداء في شكل مواقع تناسب مصطلحات البحث وتعد 
الويب بالفعل مثل الصندوق المغلق الذي لا يعرف أحد ما بداخله. كما جسد ذلك 
Paul Pedley‏ في الحديث السابق عن الويب غير المرئية والتي لا يضيء ظلمة بحث 
المعلومات داخلها سوى محركات وأدلة البحث. 
١‏ مفهوم محرك البحث 

تعددت التعريفات لمحركات البحث» ومن التعريفات التي وضعت لمحركات 
البحث : أنها عبارة عن أداة تقوم بالبحث في و/ أو عن مصادر المعلومات على 
الإنترنت ‏ والمصادر هنا يقصد بها المعلومات على الموافع وتخزين عناوينها على 
مرصد البيانات الخاص بهاء ثم تقوم بإتاحتها للمستفيدين كل حسب المصطلح أو 
المصطلحات المستخدمة في البحث ومن ثم تمكن المستفيد من الوصول إلى 
مصادر المعلومات المختلفة على الإنترنت. ويتم تجميع هذه المصادر إما بطريقة 
الية spidering or crawling‏ أو بطريقة بشرية بواسطة الإنسان CY‏ 

وقد عرف زين عبد الهادي محركات البحث في البيئة العربية على أنها 
أدوات بحث تعمل من خلال إستراتيجيات بحث محددة المنطق البوليني أو 
إستراتيجيات بحث مفتوحة باللفة العربية. وذلك للبحث في حقول أو وثائق (uas‏ 
والأكثر من ذلك أنها تبحث عن أشياء كالمادة المصورة والخرائط والأشكال 
الأخرى في بيئة محددة هي شبكة الإنترنت وذلك يعني أنها تبحث في ملايين 
المواقع ومليارات الكلمات في وقت محدد وتتميز بسرعة الاستجابة وعادة ما تكون 
إجاباتها إما مواقع على الإنترنت تتوافر فيها كل المصطلحات التي تم البحث عنها 
أو نفضها؟ او Las EFE‏ من لان Le‏ يعرف اد اللي 

لقد اعتمدت التعريفات السابقة لكل من خالد محمد رياض وزين عبد 
الهادي على التفصيلات المختلفة التي يتعرض لها محرك البحث في أداء مهامه 


)1( خالد محمد رياض. أدلة ومحركات بحث شبكة الإنترنت: دراسة مقارنة -. الاستراتيجية المربية 
الموحدة للمعلومات فى عصر الإنترنت ودراسات أخرى. الاتحاد العربى للمكتبات والمعلومات.- تونس: 
(أكتويرةة9١).‏ ص l WA‏ 

(Y)‏ زين عبد الهادي. محركات البحث على شبكة الإنترنت: دراسة تجريبية مقارنة. مجلة المكتبات 
والمعلومات العربية. ع Y‏ أبريل .٠١ gesYrY‏ 
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على الويب. وعلى ذلك was‏ اتخذت التعريفات السابقة بقة الشكل الإجرائي للحديث عن 
محرك البحث. 


وقد ذكرت بعض مواقع الويب تعريفات عن محركات البحث منها؛ إن 
محرك البحث هو بصفة عامة أداة تمكن مستخدمي الويب من الضف HAUS Lan:‏ 
وأئه يمكن أن acad satu‏ أو الإنسان فى ky ales‏ التمريف هد عمل 
على تلخيص مهمة محرك البحث وإبرازها من ناحية مستخدمي الويب دون التطرق 
إلى الإجراءات التي يقوم بها في تنفيذ هذه المهمة. وثمة تعريف آخر هو أنه 
عبارة عن أداة لإيجاد المعلومات على الإنترنت» ويتكون من مكونات خمسة هي أولا 
المتكبوة uh es gh‏ المكشف. WIG‏ قاعدة alli!‏ رابمًا برامج البحث. 
Koss ban es‏ الريك 77 . وقد اختلف هذا التعريف عما سبقه من ناحية التركيز 
على مكونات محرك البحث» وإن كان الباحث يرى أنها قد تقتصر فقط على ثلاثة 
مكونات هي الزاحف والمكشف والبحث. 


وعلى ما سبق من تعريفات يرى الباحث أن أفضل تعريف لمحركات البحث 
هو إحدى أدوات بحث استرجاع المعلومات على الويب. وتعتمد على ثلاثة برامج 
أساسية في ذلك هي الزاحف والمكشف وآليات البحث. بما يوفر القدرة على 
الإضافة والبحث. ' 


والجدير بالذكر أن هناك فرفًا بين مصطلحي محركات البحث وآليات 
البحث. فالأول إنما يعني برامج لبحث مصادر معلومات الويب. Lal‏ الثاني فهو طرق 
البحث داخل قواعد بيانات محركات البحث fie‏ آليات المنطق البوليني» والبتر 
الضمنيء واللغة الطبيعية. والبحث بالمعنى أو المفهوم... الخ. وعلى ذلك فإن ثمة 
وجهين تعمل بهما محركات البحث؛ الوجه الأول وهو الذي تتعامل به مع الإنترنت 
في عملية التجميع والفهرسة والتكشيف لموافع الويب والوجه الثاني الذي تتعامل به 
مع مستخدمي الويب طلبًا للمعلومات. والوجه الثاني قد يكون مشرقًا أمام بعض 


Sullivan, Danny. Search Engine Optimization & Marketing Glossary, (*) 
Submitawebsite, Inc, 2004, Visited at 12/6/2004, 

http://www.submitawebsite.com/seo  glossary.html 

What is a Search Engine? Metamend.inc, 2004, Visited at 12/6/2004, (Y) 
http://www.metamend.com/search-engine-map.html 
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الباحثين بالحصول على المعلومات التي يريدونها بسهولة ويسر وقد يكون عبوسًا 
أمام البعض الآخر لما يلاقيه هؤلاء من نتائج غير مطابقة لموضوعاتهم وأسئلتهم 
TNR‏ تنتج عن استخدام المصطلحات غير المناسبة لاستدعاء مصادر الموضوع. 


فالأمر هنا ليس مجرد الدراية بآليات البحث والتمرس بهاء بل يتعداه إلى 
التدخين 8( فإنه ينطوي على جانب موضوعي واحد هو (التدخين). وسؤالا عن 
(هل يسبب m‏ ال فإنه Pm‏ على e‏ هما ا 
أن يكون الباحث على دراية بماهية الموضوع NM‏ المختلفة E‏ يستطيع idis‏ 
ووضع المصطلحات التي daai‏ أخطاء gere‏ النتائج في محركات البحث التي Y‏ 
تعرف سوى مطابقة أو مضاهاة كلمات النص جميعها مع مصطلحات البحث. 

ومن ثم فيمكن أن نلخص الأسباب التي تدفع الباحثين لاستخدام محركات 
البحث في:- 
!. أن يكون لدى الياحث فكرة أو موضوع مخصص داخل دهن taldi‏ 
Y‏ أن يهدف الباحث الوصول إلى موفع محدد أو مخصص. 
LY‏ أن يهدف الباحث بحث النص الكامل لملابين من صفحات ومواقع الويب. 
Li‏ أن يهدف الباحث استدعاء كم كبير من مواقع وصفحات الويب. 
0. أن يهدف الباحث بحث نوع معين من صفحات أو ملفات الويب أو مواقع للغة 
.٦‏ أن يرغب الباحث في الحصول على ميزات تدعم بحث الويب مثل وزن النتائج 

المسترجعة أو البحث بالمفاهيم. 

١‏ أنواع محركات البحث 

تعتمد محركات البحث على نوع واحد من البرامج ج المستخدمة التي يتشابه 
أداؤها في كل أنواع المحركات وسوف يكون التقسيم هنا ليس لإبراز هذه الأنواع 
وإنما لبيان الجوانب التي يمكن أن تتناول أنواع محركات البحث عن طريقها. 


um‏ ا 


ويوضح الشكل رقم (Y-*)‏ أنواع محركات البحث مقسمة وفق التخصص.وفيما يلي 
شرح لهذه الأنواع:- 


اللغة الاسترجاع النطاق الموضوع التخصص التخصص 


الشكل رقم (Y-V)‏ يوضح أنواع محركات بحث الويب 


V/v/v/ S‏ أنواع المحركات من حيث اللغة 

تستخدم الغالبية العظمى من المحركات اللغة الإنجليزية بالإضافة إلى بعض 
اللغات الطبيعية الأخرى في البحث عن الصفحات والمواقع المتاحة على الويب؛ إلا 
أن هناك عددًا من المحركات تسمح باختيار لفة النص الذي يبحث فيهء واستبعاد 
ما دونه من اللفات. ويمكن بذلك تقسيم محركات البحث حسب لفات النص التي 

تبحث فيها إلى ما يلي:- 

-١‏ محركات بحث غير محددة اللغة: حيث لا يعطي محرك البحث هنا خيارًا 
للغة النص. وإنما agis‏ محرك البحث هنا بمضاهاة الكلمات التي جاءت في 
إستراتيجية البحث في اي صفحات وجدت. ويفيد مثل هذا النوع من 
المحركات الباحثين الذين لا يسعون إلى تحقيق Jle‏ وإنما يأتي الاستدعاء في 


c— Mm حت‎ 


المقام الأول. هذا بالإضافة إلى أن لفات النشر الإلكتروني لم تعد تقتصر على 
مجموعة لفات معينة وإنما أصبح كل من يمتلك حاسبًا UT‏ ومكانا على أحد 
خادمات الإنترنت باستطاعته النشر وإلقاء المعلومات التي يريد.ها في فضاء 
الويب. ومن ثم أصبح من غير الممكن أن يلم الباحث بكل اللفات التي ينشر 
بها الإنتاج الفكري في موضوع بحثه. ومن نماذج محركات البحث غير محددة 
ROC‏ مكرك البحف oe eser laiton Altavista‏ ورك الس 
JO alllhewel‏ 

محركات بحث محددة اللفة: يأتي هذا النوع عكس سابقه. حيث يسمح 
المحرك بالتحديد في البحث بلغات النصوص المنشورة بها صفحات الويب 
بطرق مختلفة منها؛ الطريقة الأولى : أن يقوم محرك البحث باستدعاء كل 
الصفحات التي تحوي الكلمات المفتاحية ضمن نصوصها بفض النظر عن 
اللغة. وإذا ما أراد الباحث تحديد لغة النص. فإن محرك البحث يمده بقائمة 
من اللفات الطبيعية المختلفة يختار منها الباحث ما يناسبه فيتم استيعاد 
الصفحات التي لا تقع مفردات نصها ضمن اللغة المختارة. وهنا تدخل اللغة 
كعامل محدد إضافي لنوع النتائج والوحدات التي يخرجها محرك البحث. 
الطريقة الثانية : أن يفرض محرك البحث مسبقًا لغة النص التي يرغب 
البحث عنهاء وهذه ترجع إلى الحالات التي يكون فيها محرك البحث مختصًا 
بمنطقة محددة تعتمد لها لغة خاصة يها. 

ومن نماذج محركات البحث محددة اللغة: 
محرك البحث (Google‏ 


مرك اليك alils‏ اة 


مرت الخ باللقة الف OV‏ 


http://www.Altavista.com 
http://www.Google.com 
http://www.Alltheweb.com 
http://www.Google.com 
http://www.sportec.com/ 
http://www.pratique.fr/ 
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١‏ أنواع المحركات من حيث الاسترجاع 


يقصد بأساليب الاسترجاع هنا هو كيف يتم استرجاع مواقع وصفحات 


الويب هل بالأسلوب المباشر أي باللجوء إلى بيانات الفهرسة للصفحات والمواقع. al‏ 
من حيث أساليب الاسترجاع إلى ثلاثة أنواع: 


-\ 


Q) 
(Y) 
(v) 
(t) 


محركات بحث الصفحات والمواقع : وهي الأكثر انتشارًا وتعد بمثابة محركات 
بحث من الدرجة الأولى وتعمل على جمع وتنظيم وبحث مواقع وصفحات الويب 
بشكل مباشر من خلال الاطلاع على بيانات الفهرسة الخاصة «Las‏ مثل URL‏ 
الخاص بالصفحة مع مجموعة الواصفات التي تحدد الهوية الموضوعية لهذا 
الموقع. أو من خلال التعرف إلى كلمات وردت في النص. 

ومن نماذج محركات بحث الصفحات والمواقع: 
محرك البحث Google‏ 


محرك البحث hse‏ 


محرك البحث Altavista‏ 

محركات بحث المحركات : ويعرف هذا النوع بالإنجليزية Meta Search eL,‏ 
ag -Engines‏ تعد بمثابة محركات من الدرجة الثانية» وهي تبحث في نتائج 
البحث التي تأتي بها محركات بحث الدرجة الأولى. وهذا النوع يشبه مجازا ما 
تكون عليه ببليوجرافيات الببليوجرافيات؛ إلا ان بعض محركات بحث 
المحركات تتعدى الحصر لنتائج محركات الدرجة الأولى إلى البحث والتنقيب 
المباشر في صفحات الويب. وتعرض هذه المحركات نتائج البحث إما بعرض 
نتائج البحث حسب كل محرك gl‏ أن يتم عرضها بصفة عامة دون التحديد. 

ومن نماذج محركات بحث المحركات 


محرك البحث alltheweb‏ )*( 


http://www.Google.com 
http://www.yahoo.com 
http://www.mltavista.com 
http://www.Alltheweb.com 
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١ 
í J MetaCrawler محرك البحث‎ 


محرك البحث CS‏ 


محركات بحث قواعد البيانات : يعمل هذا النوع على اكتشاف الجزء غير 
المرئي من الويب» حيث مازال يطلق على فواعد البيانات مصطلح the invisible‏ 
web‏ وتحاول هذه المحركات إخضاع محتويات فواعد البيانات من المقالات 
ومصادر المعلومات للبحث أمام الباحثين دون اللجوء إلى مواقع تلك القواعد, 
ذلك من أجل إتاحة كل مصادر معلومات الويب لإفادة الباحثين. ولقد وقفت 
طبيعة بناء قواعد البيانات حائلا أمام قدرة برامج الزاحف لاقتناء وإضافة 
الصفحات المتعمقة داخل هذه القواعد. كما تسعى محركات البحث على رفع 
343 برامج الإضافة بها لتحليل صفحات تلك القواعد Los‏ يمكن das‏ افتناء 
جميع وحدات المعلومات Jala‏ قاعدة البيانات. 
ومن نماذج محركات بحث قواعد البيانات 
محرك البحث (Y) invisibleweb‏ 


t 
( ) Webdata محرك البحث‎ 


0١‏ أنواع المحركات من حيث النطاق الجغرافي 


يتمثل التخصص الجغرافي في أن يحصر المحرك بحثه في المواقع التي 


تمع أو تتبع حدودًا جفرافية محددة؛ حيث ere‏ المحرك بجمع وتنظيم المواقع التي 


تخص منطقة أو إقليمًا Galpin‏ محددًا. وعادة يلجأ في هذه الحالة إلى البحث عن 
النطاق المعرف للدولة. وهذا النوع يوجد dis‏ الكثير على الويب. ويمكن تقسيم 


—! 


O) 
(Y) 
(T) 
(£) 


محركات بحث ذات نطاق جغرافي محدد: أي أن محركات بحث هذا النوع 
يمكن أن تفيد الباحثين بتقديم مواقع وصفحات الويب التي تنتمي إلى قارة 
من القارات. مثل المحركات التي تختص بمواقع القارة الأوربية أو تلك 


http://www.metaCrawler.com 
http://www.mamma.com 
http://www.Invisibleweb.com 
http://www.Webdata.com 
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Q) 
(Y) 
(v) 
(£) 
(v) 
o) 


المحركات التي تهتم بمواقع وصفحات الويب التي تنتمي إلى قارة أمريكا 
الشمالية. وقد تتداخل هذه المحركات مع تلك الأنواع المتخصصة قي اللغة 
وهي المناطق ذات اللغات المحدودة جغرافيًا. 

ومن نماذج محركات البحث ذات النطاق الجغرافي المحدد 
محرك بحث عن Î‏ قفن" 


Y 
١ ) canadaspace محرك بحث عن كندا‎ 


محرك بحث عن ولاية PEN Mexico‏ 

محركات بحث الدول : تقتصر عملية الإضافة والبحث داخل هذا النوع فقط 
على مواقع وصفحات الويب المنتمية للدولة التي يعمل المحرك في نطافها. 
وذلك من خلال محددات في تصميم مواقع الويب يمكن من خلالها الاستدلال 
على الدولة المنتجة للموقع. وقد يتعدى الأمر إلى المعنى الذي تقوم عليه 
الببليوجرافيا الوطنية: حيث تجمع ما ينتمي إلى الدولة بالمعنى الواسع مثل 
الذي تنشره الدولة. وما ينشر عنهاء وما تنشره مؤسسات تابعة لها في أي 

ومن نماذج محركات بحث المناطق والدول: 

محرك البحث عن مصر EEE‏ 

محرك البحث عن اليابان erebesk‏ 

محرك البحث عن فرنسا ARE‏ 

محركات بحث الأقاليم : تعمل محركات بحث الأقاليم على توسيع نطاق بحث 
الموافع بشكل اكبر اتساعًا من محركات بحث الدولء وفي الوفت ذاته لا تكون 
على قدر الاتساع نفسه في الموافع الشاملة. وياتي هذا النوع نتيجة لتشابه 


http://www.lycos.com 
http://www.canadaspace.com 
http://www.nmmagazine.com/cgi-bin/links.cgi 
http://www.egyptsearch.com/search/ 
http://www.searchdesk.com/ 
http://webmasters.abondance.com/ 
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مجموعة من الدول في اللغة والنواحي البحثية أو الاجتماعية. ويمكن أن يقال 
الثقافة في هذه الدول مثل الشرق الأوسط. أو الخليج العربي. أو دول شمال 
أوربا المعروفة باسم اسكندنافياء أو دول جنوب شرق آسيا والصين وتايوان 
والهند وهونج كونج. وتوفر هذه المحركات الدرجة العالية من الاستدعاء 
لمواقع موضوع البحث مع وجود حدود يمكن الرجوع إليها للتحكم في gua‏ 
وفيما يلي أمثلة لهذا النوع 

HE (Middle East) محرك البحث‎ 

(Latin America محرك البحث‎ 


محرك البحث )searchEurope‏ 


١‏ أنواع المحركات من حيث الموضوع 


هناك الكثير من محركات البحث على الويب تقتصر في بحثها على 
تخصص موضوعي واحد مثل الطبء أو قد يتسع ذلك ليغطي عددًا من الموضوعات 
ذات الصلة كالطب والصحة والجراحة. وتأخذ هذه المحركات في الغالب شكل 
قواعد البيانات على الويب. وهذا النوع من قواعد البيانات يهتم بموضوع محدد 
ويجمع كل ما يمكن من مواقع ومصادر معلومات إلكترونية تفيد الباحثين والمهتمين 
بهذا الموضوع. ومن ثم فإن عمل محرك البحث هنا لا يتفق كثيرًا مع المعنى الذي 
يحمله مصطلح محرك البحث؛ إلا أن الباحث قد لاحظ ذكر أنواع قواعد البيانات 
في تصنيف محركات البحث داخل الفئة المتخصصة موضوعيا. وتنقسم محركات 
البحث من حيث الموضوع إلى نوعين رئيسين هما:- 


-١‏ محركات بحث متخصصة في مجال موضوعي واحد : وهي المحركات التي 
تهتم بالبحث في أحد الموضوعات دون النظر إلى بقية فروع المعرفة. ومن 
أهم الأمثلة على هذا النوع ما يلي:- 


http://almashriq.hiof.no ©) 
http://www.yupimsn.com/index.asp (Y) 
http://www.searcheurope.com (Y) 


VA — 


ومن نماذج محركات البحث المتخصصة في موضوع واحد 
محرك بحث متخصص في الطب (P Midisearch‏ 
محرك بحث متخصص في القانون ESE‏ 
محرك بحث متخصص في العلوم (D eearch4Science‏ 
محركات بحث متخصصة في مجال موضوعي متعدد الارتباطات: وهي 
المحركات التي تعمل في مجال موضوعي يغطي مجالات معرفية ذات علاقة 
ببعضها البعض كالعلوم الاجتماعية. 

ومن نماذج محركات البحث المتخصصة في موضوع متعدد الارتباطات: 
محرك البحث في العلوم الصحية mwsearch‏ 
محرك البحث في الإنسانيات E‏ 


سحرك البحصث فی إدارة الأعمال Cake‏ 


0١‏ أنواع المحركات من حيث التخصص النوعي 


معينة من الباحثين أو تغطي معلومات. أو خدمات معينة. وتنقسم محركات البحث 
هذه إلى ثلاثة أنواع رئيسة هي:- 


-١ 


Q) 
(v) 
(Y) 
(t) 
(o) 
(Q) 
(v) 


محركات بحث متخصصة في OU‏ معينة من المستفيدين : ومن أمثلة هذا 
النوع محركات البحث المتخصصة في مواقع الأطفال. 


محرك البحث 00 


http://midisearch.net/ 
http://findlaw.com 
http://www.search4science.com/ 
http://www.mwsearch.com/ 
http://www.eserver.org/ 
http://www. business.com/ 
http://www. kidsClick.com 
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محرك البح yee Jeeves for kids‏ 
نخ ا o‏ 
محركات بحث متخصصة في معلومات معينة: ومن أمثلة هذا النوع محركات 
البحث المتخصصة في الأخبار. 
ومن نماذج محركات بحث الأخبار 
محرك البحث V songs News‏ 


3 
( J Yahoo News محرك البحث‎ 


محرك البحث AVE News‏ 
محركات بحث متخصصة في خدمات معينة: ومن أمثلة هذا النوع محركات 


a 
i Froogle محرك البحث‎ 


8 
١ )MSN Shopping محرك البحٿ‎ 


A 
١ Yahoo Shopping محرك البحث‎ 


١‏ أنواع المحركات من حيث التخصص الشكلي 


تبحث هذه المحركات في أشكال معينة من وسائط المعلومات مثل الصوت 


أو المادة المصورة أو لقطات الفيديو. وهي تعتمد في بحثها لهذه الملفات على رموز 
aa‏ النص الفائق html‏ ورموز metatag‏ وتستطيع بذلك التعرف إلى URL‏ وعمل daily‏ 
له داخل فواعد بياناتها. وهي fas‏ إلى نوعين من المحركات هي: 


O) 
(Y) 
(7) 
(t) 
(o) 
Q) 
(Y) 
(4) 


http://www.ajkids.com 
http://www. Yahooligans.com 
http://news.Google.com/ 
http://news.yahoo.com/ 
http://news.Altavista.com/ 
http://wwwfroogle.com 
http://www.msnshopping.com 
http ://www. yahooshopping.com 
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(9) 
(Y) 
(Y) 
(t) 
(o) 


محركات بحث عامة : ويطلق على Jia‏ هذا النوع من محركات البحث 
مصطلح General Media Search Engines‏ التي تجمع مختلف أنواع الوسائط التى 
تحمل المعلومات. 

ومن نماذج محركات بحث الوسائط المتعددة :- 


محرك البحث Ahê‏ 


محرك البحث Altavista‏ 

محركات بحث متخصصة : وهي محركات متخصصة في شكل معين من 
الوسائط مثل الفيديو حيث تقوم بافتناء وتكشيف وبحث ملفات الفيديو من 
خلال سمات ملف الفيديوء. الإلكترونية .Content Based Video Retrieval‏ ثم تعمل 
على الترتيب الإلكتروني لملف الفيديو كمقاطع مع ترتيب مشاهد الفيلم التي 
تدور حول مكان أو زمان واحد. كما يتم ترتيب لقطات JS‏ مشهد أيضا ثم 
وصف كل وحدة من هذه الوحدات بحسب بداية الفيديو إلى نهايته. هذا 
بجانب الوصف الببليوجرافي لملف الفيديو. وكذلك محركات بحث المواد 
المسموعة. حيث تعتمد على الروابط التي تضعها مع أسماء الأغاني أو ما 
شابهها من الملفات الأخرى. كما يغلب على هذا النوع العمل بأسلوب التصفح 
من قوائم تبدأ عادة بالمغني ثم الأعمال التي أنتجها. ومن ثم يعتمد 
الاسترجاع على ربط الأغاني بأسمائها. وكذلك محركات بحث المواد المصورة 
وهي كثيرة وسيتم تناولها بالتفصيل في هذا الفصل. 

ومن نماذج محركات البحث المتخصصة 


T 
i The Music Finder daza محرك بحث صوت‎ 


t 
00 محرك بحث صور فقط‎ 


0 
محرك بحث صور وصوت Pictures & Sounds daas‏ 00 


http://multimedia.Alltheweb.com 
http://www.Altavista.com/mutimedia/default?qbmode- 
http://www.music-finder.net/ 

www.Picsearch.om 


http://multimedia.lycos.com/ 
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۱ 
( } singingfish daas 922489 صوت‎ Cumas محرك‎ 


١‏ محركات بحث المادة المصورة 
تعد محركات المادة المصورة أو المادة المصورة image‏ على اختلاف 
أشكالها Jia‏ الرسومات والمادة المصورة الفوتوغرافية والكاريكاتيرء والخرائط. 
وغيرها .. واحدة من محركات البحث في الوسائط المتعددة. ولا يختلف بحث 
المحركات في ملفات الوسائط بصفة عامة وملفات المادة المصورة بصفة خاصة 
عنها في ملفات التنصوص. ففي كلتا الحالتين تعتمد محركات البحث على بنية 
الوثيقة المكتوبة بلغة HTML‏ في التعرف إليها وضمها إلى فاعدة بياناتهاء ويتعدى 
الأمر ذلك إلى البحث عن المصطلحات الكشفية والكلمات المعبرة عن الموضوع 
بحسب ما توجد عليه صفحات المواقع. فيمكن لمحركات البحث استخدام رموز 
(meta tags)‏ المعيارية والتي يدون فيها مصمم الصفحة كل المصطلحات المعبرة 
عن pma‏ الموقع. وفي حالة بحث page‏ الوسائط المتمددة. فإن محركات البحث 
تعتمد على المعلومات الواصفة لموضوع وشكل المادة المرئية أو المسموعة داخل 
الملف الميتاداتا. 
01١‏ مفهوم محرك بحث Salat!‏ المصورة 
لقد طرحت Paula Berinstein‏ بعض الملامح الأساسية الخاصة بمحركات 
بحث المادة المصورة والتي يجب توافرها في المحرك الكفء وهي : 
.١‏ أن يسمح بالبحث عن المأدة المصورة باستخدام الكلمات المفتاحية واستخدام 
عناصر المادة المصورة مثل التاريخ والمحتوى والمصور Photographer.‏ 
Y‏ أن يسمح بالبحث باستخدام عناصر المادة المصورة من لون وشكل والعناصر 
الاخرى. 
oT‏ أن يبحث قواعد البيانات الداخلية للمواقع الأخرى. 
؛. أن تعرض المادة المصورة كجزء من النتائج المسترجعة. 
0. أن يسمح بعرض حقوق النشر وحقوق الاستخدام وملكية المادة المصورة 
المادية. 


http://search.singingfish.com/sfw/home.jsp (*) 
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وتقدم بعض محركات بحث المادة المصورة طرفًا خلاف البحث بالكلمات 
المفتاحية. als‏ هذه الطرق هي تقسيم المجموعات إلى قوائم مصطلحات تتدرج 
من الأعم إلى الأكثر تخصصًاء ويرتبط بكل مصطلح أو موضوع مجموعة من المادة 
المصورة التي يتم عرضها فور النقر على رأس الموضوع وأفضل ما يمثل ذلك هو 


©) mS 
5 Corbis R95 


وتعمل محركات بحث المادة المصورة كفيرها من المحركات على إضافة 
مواقع هذه المادة إلى قاعدتها وتكشيفها ثم طرحها للبحث أمام المستفيدين؛ إلا أن 
الفارق الملاحظ في ادوات بحث المادة المصورة هو انها ليست في مجملها 
محركات بحث بالمعنى السابق» وإنما قد تكون في أحيان كثيرة قواعد بيانات 
للصور لا تعمل على تزويد مقتنياتها من الويب وإنما تتبع شركات لها مجموعات 
صور خاصة وبذلك يكون التزويد كما هو عليه الحال في مقتنيات المكتبات. وتحمل 
قواعد بيانات المادة المصورة مئات الملايين من هذه Salat‏ أي أن الاختلاف هو 
في غياب برنامج -spider or crawler‏ والفارق بين الاثنين كبير حيث يقتصر دور 
قاعدة البيانات على إستراتيجيات البحث daaa‏ في إدخال المادة المصورة كتسجيلة 
تكون المادة فيها جزءً! من هذه التسجيلة ولا تقوم بعمليات الإبحار على الويب 
وجمع ملفات المادة المصورة. 


"in‏ لاحظ الباحث أن تجميع وتكوين أدوات بحث المادة المصورة يكون 

على نوعين أساسين همأ:- 

.١‏ في حالة ما يكون بحث المادة المصورة جزءً! من عمل أداة بحث المادة 
المصورة. op‏ أداة البحث في هذه الحالة تتعامل مع ملفات المادة المصورة 
تجميع وإضافة ملفات المادة المصورة إلى قواعد بياناتها. 

Y‏ في حالة ما تكون أداة البحث متخصصة في بحث المادة المصورة «daas‏ فإن 
الإضافة هنا لا تكون باستخدام برامج الزاحف أو العنكبوت فقط, وإنما 
باستخدام العنصر الإنساني بالإضافة إلى قواعد البيانات. كل ذلك يأتي من 


www.Corbis.com «http://www.Corbis.com (*) 
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ol‏ أدوات بحث المادة المصورة أقرب إلى كونها acelga‏ بيانات للصور أكثر من 
كونها أداة بحث لصور الويب. 
وحيث إن عملية البحث عن المادة المصورة ليست فاصرة فقط على 
استخدام محركات البحث في الويب» وإنما أيضا قواعد البيانات المختلفة. فإن 
مصطلح نظم استرجاع المادة المصورة سيكون هو المستخدم في هذا الفصل. 


١‏ نظم إدارة واسترجاع المادة المصورة 

تعود تسمية نظم إدارة واسترجاع المادة المصورة بصفة عامة إلى الكيفية 
التي يتم العمل بها في تنظيم مجموعات هذه المادة ؛ حيث يمكن أن توجد نظم 
التصفح. وهي تنقسم بدورها إلى التصفح من خلال الكلمات المفتاحية او المكانزء 
فضلا عن التصفح من خلال لقطات المادة المصورة ذاتها أو نظم البحث الحر 
Search System‏ معم0؛ إلا أنه يمكن أن نقسمها إلى فئتين هما نظم إدارة المادة 
المصورة. ونظم استرجاع المادة المصورة: 


١‏ نظم إدارة المادة المصورة 

Technical Advisory Service أورد معهد الخدمة الفنية الاستشارية للصور‎ Aa 
أربعة أنواع عامة 5505 ملفات المادة‎ TASI المعروف اختصارًا باسم‎ for Images 
-: المصورة الرفمية وهي كما يلي‎ 


۱/٤ /١‏ نظم تصفح الملفات 


تعمل تلك البرامج على تصفح ملفات أو حافظات المادة المصورة داخل 
نظام الاسترجاع دون الرجوع إلى تلك المادة ومعالجتها Laie‏ قبل العمل على 
استدعائها؛ حيث لا يستخدم البرنامج سوى بيانات الفهرسة الأساسية التي تتعلق 
بوجود ملف المادة المصورة الرقمي على جهاز الحاسب الآلي. ومثال AJ‏ برنامج 
ACDSee‏ على اختلاف إصداراته. ويعمل هذا البرنامج في aio‏ الويندوز „Windows‏ 
ويقوم البرنامج daas‏ بعرض مجموعات المادة المصورة داخل جهاز الحاسب على 
اختلاف أماكن الحفظ على القرص الصلب دون معالجة ذاتية أو إنتاج بيانات عن 
ملفات المادة المصورة. 


— At ل‎ 


٠١‏ نظم البحث البسيطة 

تعمل هذه النظم على توفير الحد الأدنى من المعالجة الفنية لملفات المادة 
المصورة داخل فاعدة بيانات اختزان ملفات المادة المصورة. حيث تقوم هذه 
البرامج بالوصول إلى مجموعات المادة المصورة في اماكن حفظها ثم إنتاج وحدات 
على شكل مصغر منها وإنتاج بعض حقول البيانات التي يمكن من خلالها للمستفيد 
البحث بها واستدعاء تلك الوحدات المصفرة اللقطات ثم استدعاء الوحدات 
الأصلية للصور إذا ما أراد المستفيد الحصول على أصل ملف المادة المصورة 


الرفمية. 


التعريف بملفات المادة المصورة. كما أن هذه النظم لا تعتمد حتى GY‏ على أي 
نوع قياسي من أنواع قواعد البيانات التي تناسب العمل مع ملضات المادة المصورة. 
وتعمل أيضا على تمييم أو وصف وحدة واحدة من داخل مجموعات المادة المصورة 
داخل البرنامج. وتقوم النظم البسيطة Bel pas oM‏ بيانات ملفات المادة المصورة 
القائمة على pulaa‏ مختلفة IPTC, 01635, EXIF and Photoshop document (Jie‏ إلا أن 
تلك البرامج لم تصل حتى الآن إلى قراءة الحقول الخاصة بصفحات الويب. 


1١‏ نظم التصفح الكاملة 

تعمل هذه النظم بشكل أكثر تقدمًا مع ملفات المادة المصورة ؛ حيث تهتم 
هذه النظم بالتعامل مع حقول الميتاداتا اكثر من اهتمامها بالمادة المصورة ذاتها 
وذلك على غير سابقتها من النظم الأخرى. ولذلك فإن هذا النوع من النظم يعمل 
على إنتاج واجهة بحث ذات خيارات متقدمة ومتعددة لبحث ملفات المادة 
المصورة. وتقوم هذه النظم باختزان مجموعات المادة المصورة الرقمية في قواعد 
بيانات قادرة على المعالجة الفنية الدقيقة لملفات المادة المصورة تنظيمًا واختزانا 
وبحثا. 


وتعمل هذه النظم على استيراد وحدات المادة المصورة الرقمية من خارج 
النظام سواء كان ذلك بشكل ذاتي أو من خلال التعامل اليدوي مع ملفات المادة 
المصورة. ثم تقوم بإنتاج البديل للوحدات الأصلية وهي عبارة عن لقطات يتم 
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اختزانها بمكان ثابت داخل فاعدة البيانات مع إنتاج رابط لهذه الوحدة يمكن من 
استدعائها مرة أخرى. والجدير بالذكر أن ملفات المادة المصورة داخل قواعد 
البيانات هنا تأخذ أسماء مطولة مدعومة البحث من النظام إلى جانب إدخالها 
Jala‏ حوافظ folders‏ معدة من نظام الإدارة claw! ld‏ محررة ومحددة من جانب 
قاعدة البيانات. وتخدم النظم الكاملة الأعداد الكبيرة من ملفات المادة المصورة 
خلاف ما يكون عليه الحال داخل النظم السابقة. مما يعني معه ارتفاع تكاليف بناء 
تلك النظم لما تتسم به من ملامح. 
0١‏ نظم إدارة المادة المصورة المخصصة 
تحتاج هذه النظم إلى تحديد احتياجات المستفيدين من نظام إدارة المادة 
المصورة الرقمية. وذلك لأنه يتم إعداد البرامج المختلفة التي يحتاجها التعامل مع 
المادة المصورة الرقمية. وتتنوع تلك البرامج بين برامج الإضافة أو التزويد وبرامج 
بناء قواعد البيانات وبرامج البحث داخل ملفات المادة المصورة. ويمكن القول 
جملة أن هذه النظم تنشأ اعتمادًا على احتياجات محددة تستدعي الحاجة معها 
بناء نظام لإدارة ملفات المادة المصورة الرقمية ذا طبيعة خاصة. 
١‏ نظم استرجاع المادة المصورة 
تختلف نظم استرجاع المادة المصورة باختلاف النظم لما هي عليه الأسئلة 
البحثية من اختلافات. وقد ذكرت Sharon Moore‏ أنواع الأسئلة البحثية التي يتم على 
ple sus! Lai!‏ مات Sales!‏ الك و داكن oblati telg‏ عن Ay‏ := 
m‏ استخدام أسلوب التصفح داخل قاعدة بيانات المادة المصورة. وذلك من 
خلال التصفح المرئي باستخدام اللقطات أو التصفح بالكلمات المفتاحية. 
m‏ استخدام كل أو جزء من المادة المصورة موضع البحث لاسترجاع مثيلاتها 
من داخل فاعدة بيانات المادة المصورة. 
alaiul m‏ صفة أو عدة ملامح تجمع بين مجموعة من المادة المصورة al pall‏ 
استرجاعها؛ كأن يتم استدعاء كل المادة المصورة التي تخص تاريخًا محددًا 
أو GLa‏ محددًا. 


Moore, Sharon. Image Retrieval, [w. p.], 2001, Visited at 10/10/2003, at ©) 
http://tlc.dcs.gla.ac.uk/students/level3/imagedb/node13.html 
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 فصولا استخدام التفاصيل التابعة لملف المادة المصورة حقول وفقرات‎ m 
لعمل المضاهاة مع كلمات البحث المدخلة إلى قاعدة البيانات.‎ 
ولقد تعددت الأدوات فيما بينها من حيث طريقة الحفظ وطرق البحث‎ 
المستخدمة مع المادة المصورة الرقمية. ويمكن تناول أنواع نظم استرجاع المادة‎ 
=: ch كما‎ Sharon Moore المصورة الرقمية حسب طرق البحث التي أشارت إليها‎ 
استرجاع المادة المصورة بأسئلة البحث المباشر‎ 0١ 
يعرف هذا النوع بأنه يقوم على تنظيم واسترجاع المادة المصورة الرقمية‎ 
من خلال مجموعة الصفات المادية المشتقة من مكونات وشكل المادة المصورة‎ 
الرقمية. بما يمكن معه بعد ذلك طلب تلك المادة المصورة بطرح إحدى صفاتها‎ 
المادية في عملية البحث. ويستخدم هذا النوع خصيصًا في قواعد البيانات‎ 
التقليدية المعتمدة على تسجيلات وحقول بيانات لحفظ المادة المصورة الرفمية.‎ 
=: وتنقسم نظم استر جاع المادة المصورة بأسئلة البحث المباشرة إلى نوعين هما‎ 
ه نظم وصف المادة المصورة الرقمية: يعتمد هذا النظام على استخللاص‎ 
مجموعة الصفات التي تعبر عن مختلف جوانب المادة المصورة الرقمية‎ 
وتحديد عناصر المحتوى الموضوعي داخلها مع صياغتها في كلمات واصفة‎ 
حيث يمكن طلب كل صورة داخل النظام بمجموعة الواصفات المعبرة عنها.‎ 
وعلى ذلك فإن هذا النوع يحتاج إلى جهود كبيرة في عمليات تكشيف المادة‎ 
المصورة؛ حيث سيحتاج تكشيف المادة المصورة إلى الجهد الإنساني في‎ 
تكوين المحتوى الموضوعي للصورة... بينما على الجانب الآخر فإن التكشيف‎ 
الآلي للمادة المصورة يحتاج إلى تقنيات عالية في معالجة اللغة الطبيعية لكي‎ 
يتم الخروج بالكلمات المفتاحية المعبرة عن محتوى المادة المصورة والشكل‎ 
المادي من مجموعة الجمل المكونة للسياق المصاحب للصورة فى صفحة‎ 
الويب. ويمكن القول هنا إن الصعوبات التي يواجهها هذا النوع من النظم هي‎ 
الحاجة إلى الدفة المالية في التكشيف والقدرة على التعبير عن كل موضوع‎ 
من المحتوى الموضوعي العام للصورة.‎ 
نظم تحليل ملامح المادة المصورة : يبنى هذا النوع من نظم الطلب المباشر‎ m 


ibid. (*) 
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على استرجاع المادة المصورة الرقمية بالمكونات الأصلية لوعاء المادة 
المصورة مثل الشكل shape‏ واللون color‏ والبنية texture‏ حيث تأخذ هذه 
الملامح Laud‏ عددية يمكن التعامل بها مباشرة مع المادة المصورة دون 
احتياج النظام إلى كلمات واصفة أو نص مصاحب؛ حيث لا قيمة للنص في 
الاستدعاء. ويعد ذلك ما يسمى في أحيان كثيرة ب استرجاع المادة المصورة 
المبني على المحتوى .Content Based Image Retrieval‏ ويمكن أن تكون تلك 
الملامح سهلة القياس مثل عدد نقاط كثافة اللون الأحمر داخل المادة 
المصورة أو الشكل الهندسي المكون للصورة. أو أن تكون تلك المقاييس 
معقدة مثل القواعد الخاصة بتنظيم البيانات الهندسية مثل Geometrical‏ 
leg Materials‏ ذلك فإن مثل هذه القواعد تعتمد على الكميات والثوابت في 
استرجاع المادة المصورة الرقمية وهو ما لا يناسب الطبيعة التقليدية بين 
مستخدمي الويب في الحصول على المعلومات بالكلمات والعبارات البحثية. 
0١‏ الاسترجاع بالنماذج المصورة 


agas‏ هذا النوع إلى مفهوم ظهر عام ۱۹۸١‏ لتنظيم واستدعاء المادة 
المصورة الرقمية على استرجاع مجموعات المادة المصورة باستخدام مثال بحثي 
لصورة أو أكثر لاستدعاء المادة المصورة الأخرى داخل قاعدة النظام المطابقة 
لذلك المثال. ويحاول هذا النظام استخدام Line‏ الاستدعاء بالنص الكامل من 
خلال اختيار المستفيد لمثال من المادة المصورة يعبر به عن حاجته الموضوعية 
من المادة المصورة ثم البحث بها داخل المجموعة الموجودة ومن ثم يمكن للنظام 
حساب فيم اللون والشكل وفيم بنية المادة المصورة موضوع البحث ثم مطابقتها مع 
مختلف المادة المصورة. ويستخدم النظام تلك المعايير كعامل لقبول أو رفض 
المادة المصورة المستدعاة من فاعدة البيانات؛ فإذا ما احتوت المادة المصورة 
المطلوبة على قيم اللون الأحمر كان ذلك معيارًا لقبول أو رفض مجموعات المادة 
المصورة داخل القاعدة. 
وينقسم هذا النظام إلى ثلاثة أساليب للعمل هي:- 
m‏ استدعاء المادة المصورة بالنماذج المصورة الخارجية: يقصد بذلك استخدام 
المستفيد لإحدى المادة المصورة الرقمية من خارج قاعدة بيانات النظام 
للبحث بها داخل النظام. ويحصل المستفيد على تلك النماذج الخارجية من 
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مصادر مختلفة مثل تحويل المادة المصورة الفوتوغرافية التقليدية إلى الشكل 
الرقمي بواسطة أجهزة المسح الضوئي Scanners‏ أو أن يتم تحميلها من إحدى 
صفحات الويب ثم إدخالها للبحث بها داخل نظام الاسترجاع. ومن أهم 
مميزات هذا النظام هو سهولة وصف المستفيدين لاحتياجاتهم الموضوعية من 
المادة المصورة. من خلال تقديم نموذج مصور لنوع وشكل المعلومات 
المصورة المطلوبة. 

استدعاء المادة المصورة بالنماذج المصورة الداخلية : يحتاج المستفيد في 
هذا النموذج إلى استخدام محتويات فاعدة بيانات نظام الاسترجاع لتحديد 
أفضل نموذج أو صورة رقمية تعبر عن الحاجة الموضوعية؛ ثم استخدامها في 
بحث مجموعات المادة المصورة الرقمية الداخلية للنظام. وتأتي ميزة هذا 
النوع في أنه لا يرهق المستفيد بالحصول على نموذج صورة خارجية ثم 
البحث به داخل النظام. على حين أن هناك Gay‏ إضافيًا يستنفده الباحث في 
إجراء عمليات بحث هذا النظام ذلك لما يحتاجه من وفقت في إخراج صورة 
البحث. ثم يأتي وقت البحث الأصلي. 


استدعاء المادة المصورة بالرسوم التصويرية : يعطي نظام استرجاع المادة 
المصورة في هذه الحالة إمكانية الرسم التصويري لمحتوى المادة المصورة 
المراد استدعاؤها من بين مجموعات قاعدة البيانات. (Los‏ ذلك في tab‏ 
الأمر على إمكانية تصوير المستفيد لجوانب المحتوى الموضوعي للصور. هذا 
إلى جانب اختيار الشكل المحدد للصور مع اللون والخصائص الأخرى؛ إلا أن 
أهم الصعوبات التي يواجهها هذا النظام هي مدى توافر فدرات التصوير 
والرسم عند المستفيد في الوقت الذي يفتمر إلى تلك القدرة الكثير من 


7١‏ استدعاء المادة المصورة الرقمية بالتصفح 


Ue peas‏ نظام التصفح هنا احتياج المستفيد إلى صورة محددة أو أكثر 


قليلا؛ لذا فإن التصفح يعمل على إتاحة الوصول إلى محتويات قاعدة ably‏ النظام 
pu‏ ا رها الموطتوطية bc y dE dI‏ يذه aia) EE‏ 
التصفح المرئي بالتجول خلال مجموعات صور فاعدة البيانات. هذا Was‏ عن 
التصفح بالمصطلحات المفتاحية. 
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ويعد التصفح الشريك الآخر للبحث بالكلمات المفتاحية في كل من نظم 


استرجاع المعلومات على الويب المتمثلة في محركات البحث وأدلة البحث. ويتسم 
أسلوب التصفح في استدعاء مجموعات المادة المصورة بثلاثة ملامح أساسية 
“ya‏ 
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أنه الأسلوب الأكثر تفاعلية بين المستفيد ونظام الاسترجاع؛ حيث يرجع الجهد 
الأكبر في استدعاء بيانات محددة إلى اختيار وانتقاء المستفيد بما يعطيه 
القدرة على رؤية جوانب فاعدة البيانات المختلفة. 
أن المستفيد هنا هو المحدد لاتجاه البحث cling‏ البيانات المسترجعة؛ ذلك 
لما يتسم به أسلوب التصفح من كلمات تساعد على تغيير اتجاه البحث مثل 
كلمات السابقء إلى الأمام؛ إلى المستوى الأعلى. إلى المستوى الأقل. 
أن أسلوب التصفح لا يتطلب من المستفيد معرفة مختلف أوامر التعامل مع 
قاعدة البيانات فضلا عن البعد عن الجوانب المتقدمة في بناء إستراتيجيات 
البحث لكل نظام على حدةء بالشكل الذي يرهق المستفيد في معرفة أشكال 
مختلفة لأوامر واحدة أو أوامر مختلفة لنظام واحد. 

ويوجد شكلان مختلفان من تصفح فواعد بيانات المادة المصورة هما :~ 
التصفح المرئي : ويبنى هذا الشكل على تصفح مجموعات صور النظام 
واحدة تلو الآخرى. مما يعطي ابسط اشكال استرجاع المادة المصورة. وتعد 
أهم ميزات هذا الشكل هو استخدام المستفيد للعين المجردة في التأكد من 
وجود صورة بذاتها ضمن مجموعات المادة المصورة أو اختفائها عن النظام. 
Lal‏ ما يشوب هذا الشكل من عيوب فهو حاجة المستفيد إلى تصفح كل 
مجموعات النظام alay‏ صورة واحدة بعينهاء ويزيد الأمر صعوية كلما زادت 
محتويات فاعدة البيانات من مجموعات المادة المصورة الرقمية. 
التصفح بالمصطلحات المفتاحية: ويبنى هذا الشكل على تقسيم مجموعات 
المادة المصورة الرفمية داخل النظام إلى مجموعات كبرى متكاملة في 
الموضوع ثم تقسيم مجموعة المادة المصورة للموضوع العام إلى مجموعات 
لموضوعات متخصصة فرعية للموضوع العام. وعلى ذلك فإن شكل التصفح 
هنا يأخذ شكل القوائم المنبثقة عن قوائم أخرى eel‏ وصولا إلى القائمة 
الرئيسة الأولى. هذا بجانب استخدام تقنية الربط الفائق بين كل مصطلح 
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دال في كل فائمة ومجموعة المادة المصورة داخل قاعدة البيانات المعبرة عن 
دلالة هذا المصطلح. 

وتعد أهم ميزات استخدام هذا الشكل هو تحرك المستفيد داخل مجموعات 
من المادة المصورة المحددة حول موضوع diver‏ مما يفيد سرعة الوصول إلى 
المجموعة المحددة من المادة المصورة. 
0١‏ نظم استرجاع المادة المصورة الرقمية المتكاملة 

نظرًا لما اتسمت به الأنواع السابقة من نظم استرجاع المادة المصورة 
الرقمية بالكثير من الملامح التي تختلف فيما بينها بين الإيجابي والسلبي في دفة 
وكفاية استرجاع المادة المصورة الرقمية. فقد حاولت النظم المتكاملة لاسترجاع 
المادة المصورة الجمع بين ميزات النظم السابقة مع تلافي عيوبها. وقد تجمع 
النظم المتكاملة بين شكلين أو أكثر من أشكال الاسترجاع السابقة؛ حيث تعطي 
إمكانية الاستفادة من خصائص البحث المختلفة. وذلك مثل الجمع بين طريقتي 
التصفح المرئي والبحث المباشر بالكلمات المفتاحية. 

ويمكن القول هنا إنه يوجد تكامل بين مختلف طرق بحث مجموعات المادة 
المصورة وبعضها اليعض وذلك بأساليب مختلفة؛ فالأسلوب الأول لذلك التكامل 
يأتي في اعتماد نظم استرجاع المادة المصورة على البحث بالكلمات المفتاحية ثم 
عرض مجموعات المادة المصورة المطابقة للبحث في شكل شاشات نتائج يمكن 
للمستفيد تصفحها والاختيار فيما بينها. وهذا في الوفت الذي يستخدم فيه النظام 
أسلويًا واحدًا فقط هو الكلمات المفتاحية. Lol‏ الأسلوب الثاني فهو تنشيط مختلف 
طرق البحث وإعطاء واجهات بحث مختلفة تتشكل جوائبها كما يوافق طريقة 
البحث. 
o/‏ الخلاصه 

تختلف ماهية الويب عن الإنترنت ؛ حيث تعتبر الويب جزءًا من بناء 
الإنترنت له خصائصه المختلفة عن غيرها من الأجزاء. وتتنوع أساليب البحث على 
الويب ما بين استخدام أدوات البحث إلى البحث في قواعد بيانات الويب. وقد عمل 
هذا الفصل على عرض أنواع محركات البحث مع التركيز على محركات بحث 
الصور ثم الحديث عن نظم إدارة الصور الرقمية. 
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الفصل الثاني 


المادة المصورة في البيكة الرقمية 
تطبيقاتها وتقنياتها 


۰/۲ التمهيد 

۲١‏ المادة المصورة من الكهوف إلى الويب 
Y/Y‏ تطبيقات المادة المصورة 

Y/Y‏ أنواع المواد المصورة 

۲ المادة المصورة في بيئة الويب 

o/Y‏ الخللاصة 
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المادة المصورة في البيئة الرقمية 
تطبيقاتها وتقنياتها 


/Y‏ التمهيد 

إن الحديث عن أنواع المادة المصورة في البيئة الإلكترونية أو الرقمية 
Y‏ يختلف dic‏ في البيئة التقليدية. وعلى ذلك فسيكون مضمون هذا الفصل مفهوم 
المادة المصورة وتطبيقاتها في مختلف المحالات . 


7 المادة المصورة من الكهوف إلى الويب 

لقد انتهى تسجيل المعلومات في العصر الحديث إلى ما بدأ عليه في 
العصور السابقة؛ حيث بدأ التسجيل للمعلومات كرموز على الجدران وانتهى الآن إلى 
التسجيل كرموز أيضا هي لغة الحاسب (النبضات الضوئية) أو النظام الثنائي 
Gus .-.-.1‏ يكون الشكل المحدد للرقم ذا دلالة على معلومات محددة. بل 
كانت العناصر المصورة أيضا هي مكونات الرسالة التي أرادت الحضارات السابقة 
توصيلها. إن تسجيل الصور لإفادة معلومات محددة fis‏ المعارك الحربية لم يكن 
يتم من خلال آلات التصوير كما هو الآن وإنما كان السبيل الوحيد هو الرسم على 
الحوائط. ويذكر المعهد العلمي للبيانات المصورة Institute for image data research‏ أن 
المادة المصورة ترجع فى تاريخها إلى ما قبل الحضارة الرومانية . 

واتخذت المواد المصورة بعد ذلك أشكالا كثيرة في طريقها لإيصال 
المعلومات معتمدة في هذا على تطور تكنولوجيا البث المرئي للمعلومات. فأصبح 
هناك بجانب آلات التصوير التقليدية؛ آلات التصوير بأشعة إكس وتحت الحمراء 
وفوق البنفسجية للأراضي الطبيعية. ثم بعد ذلك آلات التصوير الميكروسكوبي 
لأغراض البحث العلمي» وأخيرًا الأقمار الصناعية. وتعمل الأقمار الصناعية على 
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التقاط صور لشكل الأرض الخارجي أو التقاط صور على عمق أبعد من القشرة 
الأرضية. ذلك خلاف الصور التي تتعلق بالفلك والنجوم . 

Lil‏ في مجال التخزين فقد دخلت الصور إلى الحاسبات عام 1576م على 
يد العالم Ivan Sutherland‏ الذي بدا مشروعه في رقمنة الوسائط المصورة. واخذت 
هذه الوسائط طريقها ببطء مع الحاسب إلى منتصف الثمانينات الذي شهد ألعاب 
الكمبيوتر. مما كان له أكبر الأثر في تحسيب هذا النوع من الوسائط. ثم 
استخدمت تقنيات الأقراص الضوئية في تخزين الصور الطبيعية والفنية أو التي 
تختص بالحيوانات والأشكال الطبيعية في المكتبات. ولقد لاحظ الباحث أن 
الاسترجاع داخل هذه القواعد غير المحدثة يتم من خلال التقسيم الموضوعي او 
التصفح أيضًا من خلال البحث بالكلمات المفتاحية المضافة إلى ملف الصورة. 
هذا إلى جانب انتشار وتداول قواعد بيانات الصور على الأقراص الضوئية بين 
الأفراد حيث يمكن نقل كمية كبيرة من مجموعات الصور بطريقة بسيطة إلى جانب 
إمكانية التحكم في الاستخدامات المختلفة للصور على الأقراص. ومن أهم قواعد 
البيانات المتاحة على أقراص ضوئية هي؛ photosphere‏ وهي تحمل مجموعة من 
الصور الفردية والفنية. وفاعدة the stock solution‏ وهي تحمل مجموعة من الصور 
والرسومات تصل إلى ٠٠٠٠٠١‏ صورة. ويمكن القول إن أنواع المادة المصورة 
الثابتة جاءت مختلفة تبعًا للفترات الزمنية المختلفة التي سادتها أشكال مختلفة مثل 
الرسومات واللوحات ثم الصور الفوتوغرافية التقليدية ثم الصور الفوتوغرافية 


الرفمية. 


ثم شهدت هذه الوسائط بعد ذلك الطفرة الحقيقية في الدخول إلى المجال 
الرقمي عن طريق الويب في عام 1597م إلى أن قدر عددها في عام ۹۹۷١م‏ ما 
بين ٠١‏ إلى ٠١‏ مليون وسيط. aal‏ تضاعف هذا العدد عشرات المرات في بضع 
سنوات حيث يقدر عددها على موقع مثل Corbis‏ وهو gaga‏ واحد daa‏ من مواقع 
المادة المصورة على الويب بحوالي ١٠١‏ مليون Bale‏ يمكن البحث في ٠١‏ مليون 
مقي شك oor qoare tulis, A qub Ta‏ الما امور 


Eakins, John P and Graham, Margaret E. Content-based Image Retrieval A report to (1) 
the JISC Technology Applications Program, the institute, 1999, visited at 24/9/ 
2002, http://portal.acm.org/citation.cfm?id 2614839 


كو 


الرقمية أن أعداد ملفات الصور على الويب تزيد بمعدل مليون أو أكثر من الملفات. 
aedis‏ الاد ال الزكنية عي الوم رند ole‏ رات ».مها كن 
das‏ الحجم المتزايد من ملفات المادة المصورة والذي يحتاج daa‏ أيضًا استعدادًا 
FOP HS adi Marie Paseo Ges er oie. ael‏ 


وتختلف أنماط الحديث عن المادة المصورة بحسب المراحل التاريخية التي 
عاشتها الصور في أداء مهمة الاتصال والتواصل بين الأفراد. ففي مراحل عدة 
منها؛ كان الحديث عن الرموز المصورة التي وجدت على جدران المعابد والآثار 
القديمة؛ وهي البداية الفعلية في استخدام المادة المصورة لنقل المعلومات. أما 
المرحلة الثانية فتمثلت في اختراع آلات التصوير الفوتوغرافي. وبدأت على ذلك 
مرحلة خاصة تبتعد بها عن الأنواع الأخرى من المواد المصورة مثل اللوحات 
والرسوم المختلفة... وغيرها. ثم تطورت آلات إنتاج الصور الفوتوغرافية إلى نقطة 
التلاقي مع استخدامات الحاسب لييدا Ivan Sutherland‏ عام ۱۹۹۵م مشروهًا هدف 
من خلاله إلى رقمنة المادة المصورة لاستخدامها في تطبيقات الحاسب. ثم 
تطورت مشروعات المادة المصورة الرقمية إلى أن أضحت الجانب المميز لخدمة 
الويب عن غيرها من خدمات الإنترنت. ومنذ عام ۱۹۹۳م بدأ هذا الوسيط من 
خلاله وجوده على الويب رحلة البحث عن التقعيد لعمليات المعالجة الفنية 
والاختزان والبحث داخل مواقع الويب» إلى أن أصبحت مشكلة التعامل بين المادة 
المصورة ومواقع البحث (محركات البحث) مشكلة تحتاج إلى حل Jla‏ لتحقيق 
الكفاية المرجوة في نظم استرجاع المادة المصورة على الويب. 


ويأخذ الحديث عن تناول الإنتاج الفكري المادة المصورة الرقمية أكثر من 
شكل بحسب الجوانب التي تتناولها. كما سبق الإشارة لذلك. ويمكن ذكر بعض 
الجوانب fie‏ := 


سه المادة المصورة الرفمية من منظور علم الحاسب في الاختزان والتكوين. 


٠٠٠١ و هي تبلغ‎ MAIN FRAME التيرابايت هي وحدة من وحدات قياس الذاكرة داخل الحاسبات الكبيرة‎ )١( 
تقريبا.‎ cub جيجا‎ 

Goodrum, Abby A.. Image information retrieval: an overview of current research, (Y) 

informing science, 2000, visited at 1/10/2003, 

http://64.233.161.104/search?qz cache: BRhAug3cfd 


ay 


المادة المصورة الرقمية في قياس آلات التصوير الرقمية وتقنية الكثافة. 
المادة المصورة الرقمية كنوع من أنواع التصميم الفني. 

المادة المصورة الرقمية التجارية (الدعاية والتسويق). 

المادة المصورة الرقمية البحثية والتعليمية. 

المادة المصورة الرقمية في علم الاتصال. 

المادة المصورة الرقمية كوسائط للمعلومات المرئية (استرجاع المعلومات). 


Y/Y‏ تطبيقات المادة المصورة 


/ التطبيقات العامة للمادة المصورة 


تحمل أوعية معلومات الصور الكثير من التطبيقات التي يمكن أداؤها على 


مستويات مختلفة وفى نواح متعددة. وقد ذكرت جمعية الخدمة الفنية الاستشارية 
للمادة المصورة TASI‏ أن هناك مستويات مختلفقة لاستخدام وسيط معلومات الصور 


ذكرها Laws Ashford and Graham‏ يلى:- 


(١ 


(Y 


(Y 


( 


(o 


Q) 


O) 
حيث تصاحب المادة المصورة النصوص التي‎ illustration عمل الإيضاحات‎ 
تحكي موضوعًا محددًا ويكون للصورة الدور في توضيح المعنى الذي يحمله‎ 

النص. 

معالجة المعلومات: حيث تستخدم المادة المصورة التي تحتوي على موضوعات 
أو مفاهيم للتعرف إلى سمات هذا الموضوع مثل تشخيص الأمراض أو 
الرسومات الهندسية. 

بث Information disseminationciL asa JI‏ وهو منظور علم المعلومات في أن 
المادة المصورة ذاتها وسيط معلومات. 

التعليم: وهو ما تقدمه المدارس والجامعات ومراكز البحث العلمي من مادة 
مصورة تستخدم كوسائل تعليمية. 

توليد الأفكار :Generation of ideas‏ وهو توظيف المادة المصورة فى توليد 
مجموعة جديدة من الأفكار أو الحقائق. l‏ 


Searching for and Retrieving Digital Images. TASI Technical Advisory Service for 
Images, 2003, visited at 25/4/2003, http://www.tasi.ac.uk/advice/using/ppt.html 


EE VN 


1) الأغراض الجمالية :Aestheticvalue‏ ويكون الاهتمام هنا بالجانب الظاهري 
المادة المصورة لتوظيفها في اعمال الديكور. 

(V‏ حجية الصورة :Emotive/Persuasive‏ وهي استخدام المادة المصورة كدليل 
إثبات للتاكيد على حدث أو cassa‏ محدد. هذا Waa‏ عن جانب الاحتفاظ 
بمواقف خاصة بالذاكرة الخارجية للإنسان. 

1 التطبيقات العلمية للمادة المصورة 

تتعدد احتياجات المستفيدين إلى المادة المصورة وتختلف حسب طبيعة 
التعامل معهاء بداية من الاستخدام الشخصي كذاكرة دائمة خارج الذهن تسجل 

الأحداث المتتابعة في حياة الإنسان إلى استخدامات الصحف والهيئات العلمية. 

ومن المهم أولا التعرف إلى تطبيقات هذا النوع من المادة بصفة عامة وتطبيقات 

الصور الفوتوغرافية بصفة خاصة. ذلك لأن الحاجة إلى تنظيم وسيط معلومات 
معين يعني كثرة تطبيقات هذا الوسيط واختلاف طبيعة المستفيدين منه. وحري 
ER SL‏ أن الباحث يرمي إلى الفترات التاريخية التي جاءت بعد ابتكار آلات 
التصوير أو تسجيل المعلومات المصورة. على أن الحديث هنا أيضا Y‏ يقتصر على 
الصور الفوتوغرافية فقط وإنما على كل ما يندرج أسفل مصطلح "Image"‏ مثل 
الملصقات والشفافيات والرسوم البيانية والخرائط... وغيرها من الوسائط المصورة 
الثابتة. وكل ذلك من الممكن أن يحمل معلومات ذات قيمة عالية في إعطاء حقائق 
أو نتائج تؤثر في البحث العلمي. ويفضل الباحث عرض تطبيقات المادة المصورة 

حسب المجالات العلمية المختلفةء وذلك كما يلي:- 

۲ في مجال دراسة التاريخ 

دائما ما تكون الصور أصدق كثيرًا من الكلمات في وصف الأحداث السابقةء 
ولأن مجال دراسة التاريخ يعتمد على المادة بشكل رئيس في الحصول على 
المعلومات اللازمة لاختبار الفرض التاريخيء فإنه يحتاج إلى الوسائط الخالية من 
الزيف للحصول على أصدق المعلومات. وتعد الصور شاهدًا على صدق أو كذب 

الكثير من ظواهر الماضي. 

ولا تقتصر تطبيقات المادة المصورة في مجال التاريخ daaa‏ على الاستخدام 
في إثبات الحقائق أو كمصادر لدراسة الظواهر التاريخية. فهناك الكثير من الهيئات 
المتخصصة في حفظ التراث والتاريخ تعمل الآن على جمع الصور التاريخية في بيئة 


هو 


الويب ومن ثم حفظها وعرضها ؛وذلك من خلال مواقع المتاحف والجمعيات المهنية 
في مجال التاريخ. وعلى هذا فإن الكثير من محركات بحث المادة المصورة تعمل على 
الاستفادة من مثل تلك المجموعات التاريخية. وتشير دراسة David Mattison‏ إلى تعدد 
مواقع الويب الداعمة للصور التاريخية والتي تتبع منظمات لرعاية المواد المصورة 
التاريخية Sy‏ مثل جمعية المكتبات الفنية في أمريكا الشمالية TheArt Libraries Society‏ 
ofNorth America‏ التي تم إنشاؤها في عام , وجمعية الصور الفوتوغرافية 
التاريخية في كندا Mei Photographic Historical Society of Canada‏ والجمعية الملكية 
للصور الفوتوغرافية ike Royal Photographic Society‏ 

ومن نماذج قواعد بيانات المادة المصورة في مجال التاريخ على الويب 

sa‏ انات د 
قاعدة بيانات P Sabana‏ 

1“ في مجال الهندسة والتصميم المعماري 

تعمل المادة المصورة هنا على تقريب وجهات النظر في أنواع التصميمات 
المعمارية والإنشائية والديكور. وكذلك الرسومات الميكانيكية والكهربائيةء ويتم 
حفظها لأغراض عدة منها التعليمي» deal pally‏ وإثبات وقائع تخص المواقع 
المعمارية. كما أن للمادة المصورة استخدامًا Égo‏ آخر داخليًا يتمثل في أدوات 
الاختيار (كتالوجات) للأدوات الهندسية أو الآلات في الهندسة الميكانيكية أو أنواع 
لتصميمات في الهندسة المعمارية والديكور والأثاث... الخ. وتسهم هذه الكتالوجات 
في تعريف المهندسين بآخر ما توصلت إليه التصميمات الهندسية في مجالهم . 

ومن نماذج قواعد بيانات المادة المصورة في مجال الهندسة على الويب 


M 
eet قاعدة بيانات‎ 


Mattison, david. Images of History on the Web. information today,inc, 2002, visited (1) 
at 15/10/2003, :http://www.infotoday.com/searcher/may02/mattison.htm 


http://www.arlisna.org/ (v) 
[http://www.rps.org (Y) 
http://www.open.org/~library/fotofind.html (t) 
http://seaborg.nmu.edu/earth/Life.html (o) 
http://www.afp.com/arabic/products/?pid- image () 
http://www.lifeart.com (V) 


ERE ER 


7 فى مجال الإعلام 

والحديث هنا عن الإعلام المقروء خاصة والمتمثل في مجموعات الصحف 
والمسلسلات؛ التي تحوي الملايين من الصور الفوتوغرافية التي تعبر عن الاحداث 
الجارية في شتى المجالات. فالأرشيف الصحفي الذي يضم ملايين المقالات 
والصور ليس ذقط للحفظ. بل لاسترجاع هذه الوسائط عند الحاجة إلى معلومات 
محددة. وتتجه المؤسسات الإعلامية حاليًا إلى تحويل هذه الأرشيفات إلى رقمية 
يمكن أن يستفيد منها الصحفيون من أي مكان في العالم لتدعيم مقالاتهم. 

ومن أشهر نماذج selga‏ بيانات المادة المصورة في مجال الإعلام على الويب 

قاعدة بيانات وكالة الأخبار الفرنسية Ap‏ 

۲ في مجال الطب 


يعتمد مجال الطب بصورة أساسية في البحث والتشخيص وتبادل المعلومات 
cis‏ تعدا لضب اتر را dice‏ ا وتوجد OY‏ الكثير من قواعد 
البيانات على الإنترنت تتخذ عناوين متنوعة تختص lager‏ بالصور في مجال الطب 
لأغراض التعليم. وهذه المواقع تحتوي على رسومات التشريح الخاص بأعضاء 
الجسد المختلفة. ومن أشهر نماذج قواعد بيانات المادة المصورة في مجال التعليم 
الطبي على الويب قاعدة بيانات O Life art‏ 
1 في مجال القانون وعلم الجريمة 

لعل أبرز ما يمثل استخدام المادة المصورة الرقمية في هذا المجال هو 
حفظ واسترجاع صور الأشخاص المطلوبين للعدالة. وصور بصمات اليد والأصابع 
يرافقها مجموعة من الحقول الواصفة لصاحب تلك البصمات. وتستخدم هيئات 
الشرطة حاليا الحاسبات في إعداد قواعد بيانات عن الأشخاص الممنوعين من 
السفر. وهي تضم تسجيلات ولكن بحقول مختلفة حسب طبيعة المعلومات المراد 
تنظيمها واسترجاعها فيما بعد. 


ومن نماذج acelga‏ بيانات المادة المصورة في مجال القانون على الويب 


http://fotosearch.com (*) 
http://catalog.lapl.org/a photo.html (Y) 


LY X 


قاعدة بيانات Ss‏ 
قاعدة بيانات BÎ‏ 
1 في مجال الجغرافيا والسياحة: 
يعد مجال الجغرافيا من أهم المجالات التي تعتمد على المادة المصورة 
بكافة أشكالها. وبصفة خاصة الخرائط والرسومات الطبوغرافية. وتعرف قواعد 
البيانات الجغرافية عادة Geographical Information System aul‏ واختصارا 615. وقد 
اعتمدت وكالة الفضاء الدولية ناسا NASA‏ على sacle‏ بيانات للصور الرقمية 
المتخصصة في عرض المعلومات عن كوكب الأرض وتحيط هذه القاعدة بكل 
الصور التي تغفطي سطح الأرض Ley‏ فيه الجبال والمحيطات والبراكين وأماكن 
الزلازل أو المعلومات عن الصخور المكونة لكل هذه الأشكال . وتمتد استخدامات 
الصور الجغرافية ولا سيما المناظر الطبيعية إلى مجال السفر والسياحة التي تمثل 
للكثير من الدول مصدرا رئيسًا للدخل. 
ومن gile‏ قواعد بيانات المادة المصورة في مجال Lust paced!‏ والسياحة 
على الويب 


فاعدة بيانات .accuweather‏ 


(9) 


(t) 


قاعدة بيانات torro‏ 
۲ في مجال التجارة : 
بالسلع. وتحاول الشركات المنتجة على اختلافها تسويق منتجاتها وتستخدم في ذلك 
الصور الفوتوغرافية المعبرة عن قيمة المنتج وأهميته لجذب المستهلكين إليه. 
ومن نماذج قواعد بيانات المادة المصورة فى مجال التجارة على الويب 
C) NOMAS‏ 1 
فاعدة usda ably‏ 


http://www.vsibleearth.nasa.gov/ (*) 
http://accuweather.ap.org/ (Y) 
http://www.torro.org.uk/photos.htm (Y) 
http://www.tsda.gov/oc/photo/agri11.htm (1) 
Graham, Marjaret E. THE DESCRIPTION AND INDEXING OF IMAGES: (0) 
Report of a survey of ARLIS members, Institute for IMAGE DATA () 


Research1993/99, visited at 6/10/2003, http://www.unn.ac.uk/iidr/ARLIS/. 
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1 في مجال التعليم والبحث العلمي 
تعد المادة المصورة أداة مهمة جدا وفعالة في مجال التعليم: فتستخدم 
الصور والرسومات في مرحلة رياض الأطفال ومحو الأمية. وتستخدم الوسائل 
التعليمية للطلاب في المدارس؛ وفي مجال البحث العلمي تمثل الصور الملتقطة 
بالأقمار الصناعية والميكروسكوبية عناصر أساسية مكملة للنص. وقد أكد مسح 
لمعهد أبحاث البيانات المصورة Institute for Image Data Research‏ على أن الصور 
تخدم بشكل كبير العمليات التعليمية والبحثيةء وذلك من خلال استقصاء آراء عينة 
من اختصاطيي المعتبات os asas t (Yo) asas db‏ مقت المجالات 
التعليمية نسبة ZW‏ من استخدام الصور في المناقشات العلمية والمحاضرات 
والبحث العلمي والأطروحات الأكاديمية. ومن نماذج قواعد بيانات المادة المصورة 
فضي مجال علم الحيوان فاعدة بيانات (Y) Animal Pictures Archive‏ 
وخلاصة القول فالمادة المصورة هى الوجه الآخر من العملة المكمل للمادة 
النصية. ولقد عرضت جمعية الخدمة الفنية الاستشارية للصور القيمة المضافة 
الى A (gant‏ كاي 
m‏ إن وجود صور داعمة للتعبير عن محتوى النص المصاحب يمكن أن تعبر 
بمفردها عما يهدف إلى عرضه هذا النص. 
m‏ إن الصور يجب أن تتطابق مع النصوص المصاحبة لها في الهدف. Yy‏ فإن 
النص يمكنه التعبير في حد ذاته عن الموضوع باستخدام الكلمات. 
m‏ إن وجود الصور Jala‏ النصوص لا يدعم فقط فهم المحتوى وإنما يساعد 
المتعلمين أيضا على تذكره. 
m‏ إن الصور بطبيعتها المصورة يمكنها أن تدعم قوة التخزين والاسترجاع داخل 
الذاكرة. 


http://www.animalpicturesarchive.com/ ©)‏ 
DIMP: The Use of Images to Support Instruction and Presentation. TASI Technical (Y)‏ 
Advisory Service for Images, 2003, visited at 11/12/2003,‏ 
http://www. tasi.ac.uk/advice/using/ppt_case.html‏ 
Glad (Y)‏ عبد المزيز خليفة. المواد السمعية و البصرية و المصغرات الفيلمية في المكتبات و مراكز 
المعلومات / شعبان عبد المزيز خليفة. محمد عوض العايدي- Ydo.‏ مزيدة و منقحة -. [القاهرةأ: 

SY TY yo AAAY مركز الكتاب للنشر.‎ 


m‏ إن الصور في بعض الأحيان يمكنها أن تحل بدلا من النصوص في حالات 
التعبير عن المعلومات غير الشفوية المراد إيصالها من شخص إلى آخر. 

# إن الصور ذات المحتوى الأقرب إلى النص يمكنها أن ترفع من كفاية 
المتعلمين غير المهرة في التعامل مع محتوى وسيط المعلومات ككل. 


۳/۲ أنواع المواد المصورة 

يمكن تقسيم المادة المصورة إلى قسمين أساسين هما المادة المصورة 
المتحركة. والمادة المصورة الثابتة. ويتفرع تحت كل منها أشكال Bae‏ وفيما يلي 
تعريف 0343 الأشكال:- 


الخرائط 
: التاريخية 
الفوتوغرافية 


الطبيعية 


الشكل رقم (1/Y)‏ يوضح مكان الصور الفوتوغرافية الرقمية بين أنواع المواد المرئية 


of 


V/Y/Y‏ 315211 المصورة المتحركة 

يقصد بالمادة المصورة المتحركة مجموعة الصور التي 5 تتركب من لقطات 
متتابعة وتعطي إيحاءًٌ بالحركة فور عرض هذه اللقطات بسرعة أكبر من حركة 
حدقة العين. وأنواع المواد المصورة المتحركة كما يلي:- 
۲ الأفلام 

هي مجموعة من اللقطات مصورة بطريقة متصلة ومرتبة رأسيا وأثناء 
العرض تعطي الإحساس باتصال الحركة. وقد ينطبق هذا التعبير على الأفلام 
الصامتة وكذلك على الأفلام الناطقة التي قد يعبر عنها أحيانا بالتعبير الأمريكي 
o "motion pictures"‏ . ويتم تقسيم هذه الأفلام إلى نوعين بحسب نوع الفيلم والمادة 
المصنوع منها الفيلم. !£523 الأول هو TU‏ وفد كانت هذه الأفلام صامتة ثم 
طورت إلى الأفلام الناطقة وتوجد أنواع منها تختلف باختلاف الحجم وصناعة 
الأفلام. أما النوع الثاني من الأفلام المتحركة فهو أشرطة الفيديو. والذي يصنع 
من مادة أكسيد الكربون. ويحتوي هذا النوع على أشكال مختلفة للاستخدام. وفي 
البيئة الرقمية تأخذ الأفلام طابعًا خاصًا يجعلها تختلف عن الأفلام التقليدية؛ ذلك 
من ناحية البحث والتنظيم والتنزيل أو التحميل. كما أن سرعتها تعتمد على 
الأجهزة المساعدة على العرض السريع» وسرعة التحميل. والمعالجات. ونوع 
الاتصال بالإنترنت. 

ومن نماذج قواعد البيانات التي تتيح أفلامًا على الويب:- 
فاعدة بيانات 00 
فاعدة بيانات (rafilm‏ 
قاعدة بيانات له 
7 الرسوم الحيوية 

تعد الرسوم الحيوية هي نتاج الاعتماد على الحاسبات في التصميم والتي 
تعرف باسم الجرافيك Graphic‏ . والرسوم الحيوية تستخدم مع الموسوعات 


http://www.rock-n-reel.com/ O) 
http://www.tdfilm.com/ (Y) 
http://www.webmovie.com/ (Y) 
http://www.animationusa.com/ (t) 


— \*@ — 


الإلكترونية والأغراض التعليمية وغيرها من أعمال تصميمات المباني. ويوجد من 
هذا النوع من المواد المصورة المتحركة نوعان أساسيان هما الرسوم ثنائية البعد 
2D‏ . والرسوم ثلاثية الأبعاد 30. وعلى ذلك فإن المواد المصورة المتحركة منها ما 
يرتبط وجوده بالحاسب fie‏ الرسوم الحيوية» ومنها ما يمكن للمكتبة التقليدية 
اقتناؤه وعرضه بواسطة أجهزة خاصة لذلك. 

ومن نماذج فواعد البيانات التي تتيح رسومًا حيوية على الويب:- 


١ 
) animationusa قاعدة بيانات‎ 
Y 


l Animationconnection قاعدة بيانات‎ 


قاعدة بيانات 000001 


۲ المواد المصورة الثابتة 
تتعدد الأنواع أسفل هذه الفئّة. ويطلق على كل هذه الأنواع في الغالب تسمية 
image‏ على اعتبار أنه اسم الأشكال المصورة الثابتة. وتأخذ محركات بحث الصور 
مصطلحًا Image Search Engines GG‏ وتبحث في الرسوم والصور الفوتوغرافية 
واللوحات الفنية والخرائط والرسومات البيانية وغيرها. ويكون الاختلاف بين هذه 
الأشكال في الحقول المميزة لشكل عن آخر مثل مقياس الرسم للخرائط. ونوع 
الشكل للصورة الفوتوغرافية format‏ وأنواع المواد المصورة الثابتة كما يلى:- 
7 الرسوم التوضيحية 
تعد الرسوم التوضيحية أقدم نوع استخدمه الإنسان في إيصال الأفكار. وهي 
تعني مجموعة المواد البصرية التي تحاول إيصال أفكار أو حقائق محددة من خلال 
الرسوم والتعليقات اللفظية. وتتعدد أنواع الرسوم التوضيحية إلى ما يلى:- 
ل الرسوم A SS!‏ لتخطيطية + هي مجموعة من الخطوط | Fi‏ لمستقيمة وا i‏ لمنحنية التي 
تهدف إلى تو صيل حقائق وتقديرات محددة. ود تستخدم الرسوم الدج 1 لتخطيطية 
بجانب الصور الفوتوغرافية في العملية التعليمية؛ إلا أن الصورة الفوتوغرافية 


http://www.animationconnection.com/ (9) 
http://www.allanimation.com/ (Y) 
http://www.free-graphics.com/ (Y) 


1١١5 ل‎ 


O) 
(Y) 
(r) 


أكشر اس ستقرارًا في ذهن المتلقي» حيث إنها شبيهة بالأصل خلاف ما تكون 
عليه الرسوم التخطيطية. 
ومن نماذج قواعد البيانات التي تتيح رسومًا تخطيطية على الويب:- 
sucls‏ بيانات Eri BRIE‏ 
المصورات: وهي تمثيل الشيء الأصلي؛ إلا al‏ تهمل العناصر غير الأساسية. 
وهي خلاف الرسوم التخطيطية في أنها تعتمد على الصورة أكثر من الرمز . 


ومن نماذج قواعد البيانات التي تتيح مصورات على الويب:- 
فقاعدة بيانات Fotosearch‏ 
الملصقات الجدارية: وهي لوحات ذات مكونات مختلفة من الرسومات, 
والصور الفوتوغرافية تهدف إلى جذب الانتباه إلى شيء محدد أو الإعلام عن 
شيء معين. وتستخدم هذه الملصقات في الحملات التسويقية وغيرها. 
والملصقات الرقمية اصبحت ذات اهمية كبرى للشركات القائمة على التسويق 
على الويب. مما جعل فواعد بيانات الصور تهتم يضم هذا النوع من المواد 
المصورة. 
ومن نماذج قواعد البيانات التي تتيح ملصقات على الويب:- 
فاعدة بيانات eSB‏ 
الرسوم البيانية: وهي الرسوم التي تحاول إيصال معلومات عددية أو كمية عن 
نشاط معين بتمثيل الأرقام والبيانات التي تحويها الجداول في علاقة بين 
متفيرين. ويعتبر هذا النوع أهم الأنواع المصورة الثابتة في الأغراض البحثية. 
كما أن قواعد بيانات المادة المصورة الرقمية الآن تضم أعدادًا هائلة من 
الرسوم البيانية عن مختلف المجالات. مما جعلها ملاذ الباحث في الحصول 
على ما يدعم به كلامه عن موضوع بحثي معين . 
ومن نماذج قواعد البيانات التي تتيح رسومًا بيانية على الويب:- 


fotosearch.com 
http://www.free-graphics.com/ 
http://www.free-graphics.com/ 
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Y 


O) 
في‎ 
(r) 
(t) 
(o) 


قاعدة بيانات Ereecoraphilés‏ ! » 
)~ 


قاعدة Ditto ably‏ 
الخرائط: تمثل الخرائط أداة مهمة في توضيح الحقائق والمعلومات وذلك 
بالاعتماد على الرموز والإشارات التي تقترب إلى درجة التقعيد. وتوجد أنواع 
عدة للخرائط منها الخرائط الطبيعية. والسياسية. والمناخية. والسياحية, 
وخرائط المواصلات والخرائط التاريخية... الخ. ويستخدم الحاسب الآلي في رسم 
الخرائط لإضفاء درجة أكبر من الدقة في عمل هذه الخرائط. وهي تستخدم 
أكثر ما تستخدم في الأغراض التعليمية لدراسة مناهج الجغرافيا والتاريخ. 
ويمكن تفصيل الخرائط النوعية كما يلي :- 
الخرائط الطبيعية : ويعرض هذا النوع الأشكال الطبيعية المكونة لسطح 
الأرض من جيال وهضاب ومنخفضات وبحار ومحيطات. وتستخدم هذه 
الخرائط ألوانًا ومميزات لكل شكل من الأشكال السابقة يطلق عليها مفتاح 
الخريطة؛ حيث يمكن عن طريقها تفسير محتويات الخريطة في إعطاء 
معلومات عن المنطقة التي تحددها الخريطة. ولهذا النوع استخدامات عدة 
مثل الملاحة وعلوم دراسة سطح الأرض والظواهر الطبيعية المختلفة . 

قاعدة بيانات ا 

1 alls قاعدة‎ 


فاعدة بيانات 00 


الخرائط المناخية : يوضح هذا النوع الظواهر والأحوال المناخية لمنطقة أو 
مناطق معلومة. واعتمادًا على هذا النوع يمكن دراسة ومتابعة التغيرات 
المناخية مثل الرياح والضفط والحرارة. ومن ثم يمكن التوقع بتفيرات الطقس 


http://www.ditto.com/ 
http://www.naturepl.com/frmsns.html 
http://www.photoartofnature.com/index.html 
http://www.naturepl.com/frmsns.html 
http://accuweather.ap.org/ 


YA — 


O) 
(Y) 
(") 
(£) 
(e) 


والمناخ. وتختلف بدورها العلامات المستخدمة والرموز المكونة لهذه الخرائط 
اعتمادًا على اختلاف الدلالات المنتظرة من كل نوع من أنواع الخرائط . 
ومن نماذج قواعد البيانات التي تتيح خرائط مناخية على الويب:- 
فاعدة بيانات ا 
cos Lu ade‏ و 
الخرائط السياسية : يعنى هذا النوع من الخرائط برسم الحدود بين الدول 
بما له أهمية في فصل المنازعات السياسية بين الدول وعدم التعدي من دولة 
على أخرى . 
ومن نماذج فواعد البيانات التي نتيح خرائط سياسية على الويب:- 
قاعدة بيانات Visco‏ 
خرائط المواصلات : تستخدم هذه الخرائط في عمليات الملاحة الجوية أو 
البحرية او البرية. وذلك لتبيان الطرق والمسالك في السفر. ودائمًا ما توجد 
هذه الخرائط في شركات الملاحة الجوية والبرية . 
ومن نماذج قواعد البيانات التي تتيح خرائط مواصلات على الويب:- 


قاعدة بيانات eek‏ 


الخرائط التاريخية : ترتبط هذه الخرائط بالأحداث والمواقف التاريخية. 
والاستخدام الرئيس لها يكون في الدراسات التاريخية. كما أن لهذه الخرائط 
أهمية OLS!‏ الحقائق والمواقف التاريخية. حيث تأخذ مكانًا متقدمًا في أنواع 
مصادر المعلومات التاريخية . 

ومن نماذج قواعد البيانات التي تتيح خرائط تاريخية على الويب:- 


0 
١ 1 étay قاعدة بيانات‎ 


http://www.torro.org.uk/photos.htm 

http://www.visoo.com 

http://www.metrokc.gov/gis/ 

http://jewishhistory.huji.ac.il/links/maps.htm 
http://www.lib.utexas.edu/Libs/PCL/Map. collection/historical/history. main.html 
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قاعدة بيانات ا 


قاعدة بيانات 0000 
۲ صور الأشعة 
أصبحت أجهزة التشخيص التليفزيونية والأجهزة المستخدمة في التحليل 
الطبي تلقي بالآلاف من اللوحات الطبية التي تدور حول موضوع يتعلق بمرض أو 
جزء من أجزاء الجسمء ويطلق على هذه اللوحات الطبية اسم صور الأشعة. والشق 
التنظيمي لهذا النوع من المادة يتم في أغلب حالاته اعتمادًا على التنظيم 
المستخدم لملفات المرضى أصحاب هذه التحاليل الطبية . 
ومن نماذج فواعد البيانات الطبية التي تتيح صور الأشعة على الويب:- 
قاعدة بيانات eH‏ 


S9 bref veces بيانات‎ sacls 
اللوحات الفنية‎ 


وهي مجموعة الرسومات التي تفرزها عقول الفنانين على هيئة إبداع يريد 
الفنان إيصاله في شكل فكرة إلى ذهن المتلقي مستخدما العرض المبدع وتجانس 
الألوان. وتحتل هذه اللوحات مكانا كبيرًا بين مجموعات الصور التي تضمها 
محركات بحث الصور في قواعد بياناتها بصفة عامة؛ إلا أن اللوحات الفنية لها 
واقع Gold‏ عند المهتمين بالأعمال الفنية وخاصة الأعمال القديمة» nie‏ تأخذ 
مسمى أخر هو المعارض الفنية.كما تأخذ طريقة أخرى في Gorell‏ تنبني أساسا 
على التصفح الذي يلائم أكثر في طريقة التجوال في المتاحف الفنية. وأكثر هذه 
المتاحف أو المعارض تكون مقتصرة على أعمال فنان واحد أو فترة زمنية محددة. 

ومن نماذج فواعد البيانات التي تتيح اللوحات الفنية على الويب:- 


قاعدة بيانات 0000 


http://cweb2.loc.gov/ammem/gmdhtml/gmdhome.html (*) 
http://medicine.ucsd.edu/clinicalimg/ (Y) 
http://nww. library.uthscsa.edu/ (Y) 
http://conbank.com/gx/index.htm (t) 
http ://nww. freeimages.co.uk (o) 


EMITTE 


١ 
A Freeimages Sülo قاعدة‎ 


C/Y/Y/Y‏ الرسوم الكاريكاتيرية 
يتسم هذا النوع من المواد المصورة بالفكرة التي يريد أن يوصلها الفنان 
(الكاريكاتير) وبين (الكارتون)؛ حيث يهدف الأول إلى إبراز صفات وشخصيات 
بشكل مبالغ بأسلوب أدبي أو فني. أما الكارتون فهو رسوم هزلية مبسطة وتكون 
بطريقة رمزية تمثل في الغالب Gaga‏ أو Bas‏ لشخص معين. 
قاعدة بيانات (Y) Fotosearch‏ 


o allo فاعدة‎ 


فاعدة بيانات 018 


7 الشرائح 

تتكون الشرائح من صور أو لقطات ملونة أو بيضاء وسوداء. وتثبت 
الشرائح في أطر سميكة. حيث يتم عرضها باستخدام جهاز عرض الشرائح. 
وحري بالذكر أن الشرائح باعتبارها وسيط معلومات لم توجد لها مكتبات قبل 
عام YA‏ وتطورت من الشرائح الزجاجية إلى شرائح الأفلام YXY‏ بوصة. 
ويمكن أن تكون هذه الشرائح مستقلة في المعلومات تعمل كإطارات منفصلة:؛ أو 
أن تكون لقطات متتابعة عن موضوع محدد. وتختلف الشرائح عن الشفافيات 
فالأخيرة عبارة عن أفرخ من مادة شفافة. غالبًا ما تكون من البلاستيك. وتحمل 
هذه الشفافيات معلومات قد تكون صورًا أو أشكالا أو رسومات تدل على حقائق 
معينة. ومن هذه الشفافيات نوعان هما الشكل الملفوف. والشكل المسطح. وهناك 
أيضا الفيلمات أو الشرائح الفيلمية وهي مجموعة اللقطات المتصلة والتي قد ترقم 


www.fotosearch.com O) 
www.google.com (Y) 
http://www.cartoonbank.com/ (Y) 


YO7YY شعبان عبد العزيز خليفة. مرجع سابق. ص‎ (t) 


— ۹۷۷س 


Y‏ ترفم. ويستخدم لعرض هذه الفيلمات جهاز عرض يدوي أو آلي. وتقف هده 
الفيلمات في منطقة وسط بين اللقطات الفيلمية الثابتة والأفلام المتحركة؛ حيث 


إنها عبارة عن لقطات كان يمكن أن تكون منفصلة لكن تم إبقاؤها على اتصالها 
)© 


Mas 
ومن نماذج فواعد البيانات التي تتيح الشرائح على الويب:-‎ 
Y woridbank قاعدة بيانات‎ 
الطوابع‎ ۲ 


تعد هواية جمع الطوابع هي الأساس في جعل الكثير من قواعد الصور 
تقتني مجموعات من الطوابع لخدمة هذا الهدف eni‏ الثقافية أيضا. ومن 
المنظور المعلوماتي لهذا النوع من المادة المصورة. فإنها تحتوي على معلومات ذات 
قيمة تعريفية بالأحداث والموافقف المهمة التي مرت بها TUM JS‏ حيث لا تصمم 
الطوابع إلا بواقع أحداث أثرت في حياة الدولة . 


newer cm قاعدة بيانات‎ 
C opgie قاعدة بيانات‎ 


(e) Ju cce ted 
yahoo قاعدة بيانات‎ 


7۷ الصور الفوتوغرافية 

تستخدم الصور في التعبير عن الأشياء والأحداث والشخصيات بشكلها الذي 
حدثت به aclu‏ التقاط الصورة؛ وهذا التعبير يتم من خلال نقل شكل الحقائق 
والأشياء على ورق سالب باستخدام مصدر ضوئي. وقد كانت أول آلة تصوير تم 
استخدامها في عام «aAA‏ وذلك عن طريق شركة lags‏ باستخدام الأفلام 
الملفوفة. ثم تطورت تقنيات التصوير فاصبح هناك تصوير بالافمار الصناعية, 
وأخرى ميكروسكوبية؛ واستخدام آلات التصوير الرقمية مع باقي lil‏ التصوير 


http://www.worldbank.org/html/extdr/emps/photo.htm ©) 
http://www.luxcentral.com/stamps/LuxStampsDB. html (Y) 
wwww.google.com (Y) 
www.yahoo.com (t) 
www.corbis.com (o) 
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الأخرى. أما عن سبل إتاحة الصورء فهي Lal‏ ورقية أو فيلمية أو رقمية. وتعد 
الأخيرة هي موضوع هذه الرسالة وسوف نتعرض لها بالتفصيل. 


ومن نماذج قواعد البيانات التي تتيح صورًا فوتوغرافية على الويب:- 
فاعدة بيانات O) corbis‏ 
قاعدة بيانات 0000 

قاعدة بيانات Ditto‏ 


۲ المادة المصورة في بيئة الويب 


تمثل عملية التكشيف البداية لأي حديث عن استرجاع المادة المصورة. ذلك 
لأن الاسترجاع إنما يكون liag‏ للتنظيم والمعالجة الفنية Sala‏ والتي تعتمد بدورها 
على الوصف المادي والتحليل الموضوعي لها. وكما هو معروف لدى كل اختصاصيي 
المعلومات. فإن polie‏ الوصف المادي والتحليل الموضوعي هي المحور الرئيس 
للمادة المصورة في البيئة التقليدية. ولا يختلف الأمر عن ذلك في ain‏ الويب 
باستثناء عدد من العناصر التي أضيفت لأغراض الاسترجاع. وتتنوع هذه العناصر 
من مادة مصورة إلى asal‏ وحيث إن الحديث عن كل أنواع المواد المصورة يتعدى 
حدود هذه الرسألة. فإننا سنقصر الحديث هنا على الصور الفوتوغرافية فقط 
باعتبارها موضوع هذه الدراسة. 


۲ الصور الفوتوغرافية في بيئة الويب 
إن الصور الفوتوغرافية الرقمية على الويب تشهد نمؤا متزايدًا في أعداد 
مواقعها وحجم قواعد بياناتها. وقد ظهرت أنواع مختلفة من قواعد ally‏ الصور 


الفوتوغرافية؛ دفعت القائمين على المواقع إلى التخصص. وتتعدد المجالات التي 
تضمها هذه الصور؛ إلا أنه لأغراض هذه الدراسة يمكن تقسيمها إلى ثلاثة أنواع 


Ug أساسية‎ 
www.freefoto.com (*) 
www.ditto.com (Y) 
http://www.astronomy.ca/images/ (Y) 
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O) 
(Y) 
(r) 
(t) 


الصور الفوتوغرافية العلمية : هي الصور التي تختص بصرر العلوم الطبيعية 
والبيولوجية والزراعية والطبية وما ينشق عن هذه العلوم. وتبرز أهمية الصور 
في هذه العلوم؛ لأن الوصف بالكلمات قد يكون غير مناسب في بعض المواضع 
بل يكون مستحيلا في الكثير منها. فصور الأرض والمريخ. وصور البراكين 
والزلازل. وصور البكتيريا والفيروسات. وصور أمراض النبات. وصور الأورام 
الخبيثة وغيرها تكون الصورة فيها هي الأصل ويصاحبها بعض الكلمات للربط 
بين اللقطة والمسمى العلمي للمحتوى . 
ومن نماذج فواعد البيانات التي نتيح صورًا فوتوغرافية علمية على الويب 
قاعدة بيانات في مجال الفضاء oR‏ 


قاعدة بيانات في مجال الجيولوجيا  Wordwed‏ 


الصور الفوتوغرافية الإعلامية : وهي مجموعة الصور التي تعبر عن 
الأحدات الجارية. إضافة إلى كونها الركن الثاني لللإعلام المقروء بجانب 
على الويب . 


ومن نماذج فواعد البيانات التي تتيح صورًا فوتوغرافية إعلامية على الويب :- 
قاعدة بيانات (o1 1digitalarchive‏ 


فاعدة alas able‏ واشنطن يوست 000000 


الصور الفوتوغرافية العامة : وهي مجموعة الصور التي لا تحوى أشكالا 
علمية او ظواهر بحثية تنتمي إلى مجال موضوعي (asa‏ وإنما هي مجموعة 
من الرموز وعناصر من الطبيعة العامة أو أشخاص أو أحداث يراد من خلالها 
إيصال معلومات محددة. وتعد الصور jJ‏ 4103 الطبيعية هى لب هذه الدراسة 
ومحورها الأساس بالنظر إلى خصائص ومحتوى هذا النوع وكيفية التعامل معه 
http://wordweb.com/docs/gallery/geo/‏ 

http://911digitalarchive.org/ 


http://www. photostore.com/psx/index.html 


www.corbis.com 
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بما يوفر أفضل استرجاع ممكن. ومن نماذج قواعد البيانات التي تتيح صورًا 
فوتوغرافية dale‏ على الويب:- 
قاعدة بيانات O corbis‏ 
قاعدة reer aba‏ 
E‏ قبا نان 

وتتنوع قواعد بيانات الصور الفوتوغرافية من حيث العدد والمحتوى على 
الويب. فلقد لمع فضاء الويب بقواعد بيانات الصور الطبيعية مع إطلاق مسمى آخر 
هو قواعد بيانات الصور العامة ذلك GY‏ قواعد بيانات الصور العلمية اعتمدت في 
نشأتها على الجمعيات والجامعات الأقسام العلمية. على الجانب الآخر من قواعد 
بيانات الصور فإن محركات بحث الصور لم يظهر منها حتى الآن النوع المتخصص 
في بحث الصور العلمية؛ وإنما تحمل كل انواع محركات بحث الصور مصطاحًا 
(عاما). والاختلاف بين قاعدة بيانات الصور ومحرك بحث الصور هو اختلاف 
OH‏ يرجع إلى الاختلاف في طبيعة افتناء الصور بجانب طبيعة تكشيف ملفات 
الصور. ويثبت ذلك أن الصور العلمية لا يوجد لها محركات بحث الصور بحسب ما 
يقتضيه مصطلح محرك البحثء وإنما توجد لها فواعد بيانات تتخصص بعرض 
صور مجال موضوعي معين» بينما تسكن الصور الطبيعية قلب كل من فواعد بيانات 
الويب ومحركات بحثها. بحسب ما يقتضي مفهوم كل من المصطلحين. 

ومن ناحية أخرى فقد تكون قواعد البيانات متخصصة بالشكل الذي فصلناه. 
وقد يجتمع نوعان منها أو الثلاثة La‏ في قاعدة بيانات واحدة. فوفقا لما oly‏ الباحث 
من هذه القواعد. فإن قواعد بيانات الصور العلمية لا يمكن أن تحوي صورًا طبيعية أو 
عامة.. بينما يمكن لقواعد الصور العامة أن تحوي بين مجموعاتها صورًا علمية. 

وتأخذ الصور العامة نفس خصائص الوصف الببليوجرافي التي يمكن العمل 
بها على كل من الصور العلمية والإعلامية. إضافة إلى استخدام كل عناصر وحقول 


www.freefoto.com (‘) 
www.ditto.com (Y) 
A Metadata Framework to Support the Digital Resource Management. (Y) 


Texas university, 2003, visited at 10/10/2003, 
http://texashistory.unt.edu/guides/Draft-UNTL-Metadata-Guideline.htm 
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التسجيلة الببليوجرافية إلا ما يندرج Jiul‏ نوع بذاتهء وهذا يرجع إلى توافق الأنواع 
الثلاثة في خصائص الصورة كمادة مرئية» والتشابه في ملفات الصور الرقمية 
بحسب الشكل Format‏ الذي ستكون عليه صور قاعدة البيانات. وترجع إرهاصات 
معايير ومواصفات الصور إلى الاعتماد على نوع الصور العامة؛ مثل ما كان عليه 
معيار دبلن كورء وهو ما سيأتي الحديث dic‏ في معالجة الصور الرقمية. 


۲ الوصف المادي للصور الفوتوغرافية على الويب 

تركز الوصف المادي للصور الفوتوغرافية في الويب على عناصر ثلاثة أساسية 
هي: المصور. والنوعء والشكل الفني ...الخ. وهو في ذلك يتشابه إلى حد كبير للوصف 
المادي للصور الفوتوغرافية في البيئة التقليدية. ثم أضافت بعض قواعد البيانات 
عناصر أخرى هي اللون والشكل shape‏ في عمليات المضاهاة واسترجاع الصور. 

وقد حاولت بعض الهيئات صياغة نماذج لما يمكن أن تكون عليه حقول 
الوصف داخل ملفات الصور. واعتمدت جاممة تکساس Texas University‏ 55445 جا 
لحقول الأشكال المختلفة من المادة داخل الويب. وخصص النموذج مجموعة من 
الحقول الجديدة لوصف ملقات الصور داخل Fy‏ الويب» وكانت كما يلي( 


الجدول رقم polic (1-Y)‏ جامعة تكساس لوصف الصورة الرقمية 


وصف ملف الصورة 
شكل إصدارة ملف الصورة 4.0 TIFF v‏ 
| كثافة العرض داخل الصورة dpi; 300 dpi, 1500 0 | RESOLUTION‏ 600 
x 6144 pixels | "TFT*I‏ 4096 
كثافة ألوان الصورة | 1-bit; 8-bit grayscale; 24-bit color‏ 
توزيع الألوان CMYK; RGB IMAGE COLOR SPACE‏ | 
zip file, CCIT 4 | elata aus |‏ | 
do‏ 
Martinez, Aanne. GIF vs. JPG vs. PNG. Mc GrawHill companies, 2001 inc, (*)‏ 


citd (20/7/2002), (http://www.cheapwebrich's.com/articles/gif jpg png.htm!) 
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وعلى الرغم من هذه الجهود, ee‏ 


للصورة مازالت فيد deat!‏ وذلك لارتياطها بالجهات المهنية التي ت تفتج الصور. mu‏ 


سبيل المثال توجد ثلاثة أشكال فنية formats‏ أساسية للصور الرقمية هى 


0) 


TUE 


شكل :GIF‏ وهو اختصار ل (graphic interchange format)‏ وهذا النوع من 
خصائصه الخط البسيط في الرسم وقلة الألوان في الصورةء كما أنه يدعم 
الرسوم الحيوية. وفد تم إنتاج هذا النوع من جائب شركة «CompuServe‏ وذلك 
في منتصف الثمانينات. وكان هذا لأجل أن يتم سرعة نقل الرسوم الكبيرة 
عن طريق تصفير حجمها بالضفط لملفات هذه الرسوم. وموضع استخدام 
هذا النوع في TO‏ الأيقونات icons‏ وهى الرسومات البسيطة واللقطات 
الصغيرة للصور. ويوجد داخل هذا الشكل نوعان هما .87a, 89a‏ أما النوع 89a‏ 
فهو يستخدم بصفة خاصة في أنواع الملفات التي يمكن إظهار لون مخصص 
من ألوان الصورة وعرضه بغض النظر عن إظهار أي من الألوان الأخرىء 
سواء كانت الحدود الأريعة للصورة أو الألوان الداخلية ae‏ ويرى الباحث 
أنه يمكن استخدام هذا النوع في نظم الاسترجاع التي لا تعتمد على النص 
المضاحب للصورة. بل تسترجع بمضاهاة الألوان داخل الصورة: 


شكل :JPEG‏ وهو اختصار (Joint Photographs Expert Group)‏ وهذا النوع يدعم 
الصور ذات الألوان الكثيرة. كما أنه يدعم اختزان وعرض الصور 
الفوتوغرافية أكثر من الأنواع الأخرى. وينطق هذا الاختصار حسب المقطع 
الصوتي .(jay-peg)‏ ويعتبر هذا النوع هو الأكثر استخدامًا على الويب. ويعود 
ذلك إلى أنه يمكن ضغط bile‏ الصور وتصفيرها مما يؤدي إلى كفاية في 
عملية الحفظ والاسترجاع. ويمكن ضغط هذا النوع من الملفات بنسبة ١:0‏ إلى 
V0:‏ 


E :PNG ER‏ به M i -Portable Network Graphics‏ هو 
البحث؛ إلا أنه نتيجة لمميزاته سوف يصبح الأكثر شيوعًا e‏ الويب فيما 


Martinez, anne GIF vs. JPG vs. PNG. mcgrawhill companies, inc,2001, 
citd (20/7/2002), (http://www.cheapwebrich's.com/articles/gif jpg. png.html) 
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O) 


بعد. وقد صمم هذا النوع تحديدا ليكون بديلا عن استخدام شكل -GIF‏ ومازال 
هذا النوع ينتظر الانتشار بين مواقع الويب المختلفة. 

وهذه الأنواع هي الأكثر استخدامًا في محركات البحث؛ إلا أن هناك أنواعًا 
أخرى كثيرة يمكن العمل بها في محركات البحث لكنها أقل استخدامًا 
ER‏ 

شكل BMP‏ وهذا الشكل يعد من الأشكال الأقل استخدامًا على الإنترنت ذلك 
لأنه فد تم إنتاجه للعمل في di‏ نظام التشغيل ويندوز Microsoft windows‏ 
operating system‏ وحجم هذا الملف كبير لذا لا يتم التعامل في محركات بحث 
الإنترنت. كما أن هذا الشكل لا يدعم التعامل مع النظم الأخرى. 

شكل :TIFF‏ وهو اختصار Tag Image File Format‏ وقد تم z=!‏ هذا الشكل في 
منتصف الثمانينات من قبل شركة متخصصة في إنتاج صور الويب وأسطح 
المكتب Desk tops‏ وأنتج هذا الشكل خمسيصا للحفاظ على الصور التي يتم 
نقلها في ملفات ذات جودة عالية. ويعمل هذا الشكل على أكثر من نظام 
تشغيل مثل ويندوز «windows‏ اجهزة «Macintosh‏ يونيكس UNIX‏ ويمكن لهذا 
الشكل أن يكون في وضع مضغوط أو غير مضغوط. 

شكل PICT‏ وهذا الشكل قد تم إنتاجه أيضا في منتصف الثمانينات» على أن 
يستخدم لملفات الرسومات الضخمة مثل ملفات الفيديو والرسوم الحيوية. 
وعلى ذلك فهو BUS‏ الاتجاه الذي يسير عليه شكل JPEG‏ كشكل للملفات 
الخفيفة. 


وتستخدم هذه الأنواع بحسب مميزات كل نوع منهاء وأهمية هذه الأنواع في أن 
نظم استرجاع الصور تعتمد في أحيان كثيرة على الشكل وخصائصه كما في 
الملفات الرقمية. هذا إلى جانب مجموعة من الأشكال التي تحدثت عنها 
جمعية الخدمة الفنية الاستشارية ا 1 والتي تتلخص في SW‏ :- 


File Formats. TASI Technical Advisory Service for Images, 2003, VISITED 

AT 24/4/2003 , http://www.tasi.ac.uk/advice/creating/fformat.html 

Eriksson Yvone. How to make tactile pictures understandable to blind reader, 
international federation of library associations and institutions(IFLA), 1999, visited 
(1/12/2001), http://www.tasi.ac.uk/advice/creating/fformat.html 
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TIF ولا يختلف كثيرًا عن أشكال‎ (Windows PaintBrush وهو اختصار‎ :PCX JSS 
إلا أن هذا النوع لا يستخدم في بيئة تشغيل الويندوز. وهو على درجة‎ tand PNG 
Macintosh. من الفائدة في الأداء مع اجهزة الماكينتوش‎ 

شكل TGA‏ يعتبر هذا الشكل أكثر أشكال ملفات الصور شيوعًا من حيث جودة 
الكثافة العالية للصور ويمكن الحصول على هذا الشكل من خلال أجهزة 
إدخال الصور الرقمية كما أنه يدعم درجات اللون المختلفة مثل Yo Y£ VV A‏ 
بت .BIT‏ 

شكل EPS‏ وهو اختصار Encapsulated PostScript‏ وقد أنتجته شركة Adobe‏ 
Systems Inc.‏ ويمكن لهذا الشكل العمل على أكثر من نظام تشغيل فضلا عن 
إمكانية تحويل هذه الملفات إلى الأشكال الأخرى. ويستخدم شكل EPS‏ للعمل 
مع الملفات المراد طباعتها. 

شكل :SVG‏ وهو Scalable Vector Graphics Lai!‏ ويستخدم هذا الشكل بشكل 
معياري مع لغة (Extensible Markup Language) «XML‏ وهي النموذج المتقدم للغات 
الترميز المعيارية ويستطيع هذا الشكل أن يضم LS‏ مصاحبًا للرسومات. كما 
يمكن إدخال التحرير بعيدًا عن الصورة. وهذا خلاف ما يحدث في الأنواع 
الأخرى حيث يظهر النص داخل إطار الصورة. 

شكل :CGM‏ وهو اختصار «Computer Graphics Metafile‏ وقد تم تصميم هذا 
الشكل بواسطة المعهد القومي الأمريكي للتقييس ANSI‏ لكي يتم وضع بناء أولي 
لتبادل مواد الرسومات الرفقمية. 

شكل :WMF‏ وهو اختصار Windows Metafile‏ ويقوم هذا الشكل على احتواء 
أشكال المخططات الثانية والرسومات كي يتم رفعها إلى درجة الكثافة 
المطلوبة على شاشة العرض. 

شكل :RIFF‏ وهو اختصار Resource Interchange File Format‏ وهو شكل calet!‏ 
متعدد المصادرء ويتكون هذا الشكل من مجموعة بنى متداخلة خلاف ما تدعم 
الوسائط المتعددة. وقد خرج هذا الشكل بواسطة شركتي Microsoft and IBM‏ 
شكل :DIB‏ وهو اختصار Device Independent Bitmap‏ وتعمل ملفات هذا الشكل 
داخل atus‏ التشغيل windows‏ ويمكن عرض هذه الملفات من خلال أجهزة 
عرض مختلفة. ويشابه هذا النوع شكل DMP‏ لعرض الصور والذي يدعم فتح 
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ملفات الصور في أكثر من حزمة برامج. ويعد هذا النوع شائع الاستخدام في 
حزم البرامج التي تتطلب فتح ملفات الصور في أكثر من نوع من البرامج. 

w‏ — شكل :FlashPix‏ تم إنتاجه بواسطة شركة Kodak‏ وقد اطلق عليه الشكل 
المفتوح من ملفات الصور. ويساعد تصميم هذا الشكل على التفاعل مع 
التطبيقات المختلفة بشكل متوازن؛ حيث يمكنه خفض الكثافة resolution‏ في 
حالة استخدام شاشات العرض. أو رفع الكثافة أثناء الحاجة إلى الطباعة. كما 
أنه يتسم بعدة ملامح مختلفة تلائم حاجة السوق الذي تتعدد فيه استخدامات 
الصور؛ مثل حقول البيانات. وحق النشر. وتنظيم وتهيئة الألوان. 

:SPIFF/SPF JSS m‏ وهو اختصار Still Picture Interchange File Format‏ وهو بمثابة 
الشكل الرسمي لشكل JPEG‏ ومازال استخدام هذا الشكل قليلا نسبيًا نظرًا 
لحداثة خروجه؛ إلا أنه من المتوقع انتشاره نظرًا لأنه يدعم الكثير من 
تطبيقات ملفات الصور. 

وتظهر أهمية هذا التنوع في Formats‏ عند استخدام عناصر بناء لغة 
الترميز المعيارية للنص الفائق HTML‏ ولان محركات البحث كانت الخطوة التالية 
بعد بناء صفحات الويب. فقد بني عمل هذه المحركات في الافتناء والتكشيف 

والاسترجاع على بنية ملفات HTM!‏ وليست ملفات الصور T‏ عن هذا التعامل, 

بل أنها تأخذ كل خصائص ملفات النص الفائق والوسائط الفائقة Hyper Text and‏ 

Hyper Media‏ في الإضافة والاسترجاع. ولا يختلف الأمر بين أنواع الملفات إلا بوجود 

النص. 

۲ التحليل الموضوعي للصور الفوتوغرافية على الويب 

يحتل التحليل الموضوعي درجة أكثر من الأهمية عن نظيره المادي في 
الاسترجاع على الويب؛ ذلك لأن البحث دائما في الويب يكون حسب الحاجة لموضوع 

معين. ويعتمد التحليل الموضوعي للصور على الويب على عنصرين أساسين الأول: 

طبيعة الصورة: والثاني: السياسة التي سيتبعها المكشف لهذه الصور. 

فبالنسبة للعنصر الأول فإن استخدام الكلمات المفتاحية للصورة العلمية 
يختلف عنها في الإعلامية او في الطبيعية. ففي الصور العلمية. لا يكون هناك 
مجال كبير للاجتهاد بالنسبة للمكشف. حيث يجب عليه استخدام المصطلحات 
العلمية الواصفة للصورة. فالصور العلمية دائما ما تحوي اشكالا او ald polie‏ 
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دلالة ثابتة. وعن طريق ذلك فإنه من اليسير إيجاد التوافق بين المكشف والمستفيد 
من نظام الاسترجاع. ويمكن لعملية التكشيف والاسترجاع أن تصل إلى درجة 
التحقيق العالية من خلال الاعتماد على مكنز لهذا الموضوع أو العلم الذي بصدده 
عملية التكشيف. ويقوم هذا المكنز بإيجاد التقنين واستخدامه كأداة للمكشف أثناء 
التنظيم واستخدامه كقائمة للاستناد للباحث اثناء الاسترجاع. وعلى ذلك Obs‏ 
الدلالة التي تكون عليها مصطلحات هذه العلوم سوف تسهم في الوصول إلى الدرجة 
العالية في التحقيق وفي الوقت نفسه تحمي المستفيد من نسب الشوشرة (النتائج 
غير الصحيحة) التي تؤثر على النتائج المسترجعة. 

أما في الصورة الإعلامية. فإن هناك مساحتين للمكشف الأولى: الحاكمة وهي 
تلك التي تصف عناصر الصورة مثل الشخصيات أو الأماكن أو الأحداث التي تظهر 
في الصورة. وهذه العناصر يمكن أن تحكمها قوائم استناد لتوحيد المسميات الخاصة 
بالشخصيات. والمناطق dual part!‏ والأحداث. أما الثانية: وهى غير الحاكمة ويعبر 
فيها المكشف عن خلفية الصورة أو الانفعالات التي تطرحها الصورة مثل الضحك. 
والعبوس, والوقوف. والجلوس وغيرهاء وهو ما يعرف باسم الصورة الذهنية. وبالتأكيد 
فإن وصف هده الانفعالات يعتمد بشكل رئيس على الانطباعات التي تتركها الصورة في 
نفس المتلقي ومن ثم تنعكس على طريقة توصيفها. وهي بلا شك أكثر عرضة 
للاختلاف بين المكشف والباحث وتولد درجة غير قليلة من الشوشرة. 

Ll‏ في الصور العامة. فهناك ثلاث مساحات للمكشف, الأولى: الحاكمة 
وهي التي تصف العناصر الرئيسة في الصورة مثل الجبال والأنهار والطيور وغيرها 
وهذه يسهل توصيفها. والثانية: الذهنية وهي التي تصف الخلفية للصورة وما تتركه 
من انطباعات وهذه أكثر عرضة للاختلاف بين المكشف والباحث كما هو الحال في 
الصور الإعلامية. والثالثة: الضمنية وهي التي تخرج عن دائرة الوصف الموضوعي 
إلى المعنوي. كأن يوضع لفظ (جمال) ككلمة مفتاحية للتعبير عن صورة : وردة 
متفتحة . ومما لا شك فيه أن هذه المساحة الثالثة هي أكثرها صعوبة على الإطلاق 
نظرًا لعدم وجود قواعد يمكن الرجوع إليها بشأن تلك المعاني الضمنية. 

علاوة على ذلك فإن الحديث عن استرجاع الصور الفوتوغرافية في بيئة 
الويب. أمرغير يسيرء وذلك لأنه يتضمن تغيير لفة التعبير عن المحتوى من وسط 
إلى اخر؛ اي من وسط الصورة إلى وسط النص. وإضافة إلى ذلك فإن اختيار 
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أفضل الكلمات للتعبير عن المحتوى pal‏ يعود إلى وجهة نظر المكشف» وقد توصف 
الصورة بأكثر من وصف للمحتوى ولا خطأ في أي منها. وبذلك فان الأمر يحتاج 
إلى الوصف بدرجة أكبر من التحليل ويتم ذلك على أربع مراحل؛ أولا: أن يتم 
وصف الصورة بشكل ale‏ ثانيا: أن يتم تحديد كل عنصر من عناصر الصورة 
للاقتراب أكثر من محتوى الصورة الموضوعي, ثالثا: أن يتم وصف الصورة بشكل 
مفصل يجعل ملامح الموضوع أكثر وضوحا للقارئ. أما المستوى الأخير فهو إعطاء 
وصف ملخص عن الصورة بشكل pale‏ لكل ما يمكن الحديث O ae‏ 


أما بالنسبة للسياسات فيواجه المكشف مجموعة من الأسئلة التي يجب أن 
يعرف إجاباتها سلفا حتى يحدث الاتساق والاطراد في التكشيف بمعنى هل تكون 
المصطلحات المفردة أو الواصفات المستقلة هي الأفضل أم النص السردي 
والمستخلص هي الأكثر فاعلية S‏ ولقد لاحظ الباحث في وصف محركات البحث 
لمجموعاتها من الصور. أنها تكون AIL‏ الطبيعية أقرب في حالتها إلى المستخلص 
الذي يسرد موضوع ما وهو ما يوافق طبيعة الصورة؛ ذلك لأننا عندما نقول إن 
الصورة تفوق آلاف الكلمات. فإن هذا الكم من الكلمات لموضوع من الصعب التعبير 
dic‏ بكلمات قلائل في JSS‏ منفرد مث الواصفات أو الكلمات الكشفية © 


وعلى ما سبق يمكن القول إن استخدام حقول البيانات الواصفة داخل 
ملفات الصور الرفمية يعني إضافة بيانات معبرة عن شكل الصورة ومحتواها سواء 
في صفحة الويب الأصلية أو داخل قاعدة محركات بحث الصور أو داخل منفذ 
المستخدم النهائي عند تحميل الصورة أو إرسالها Lag .emailed or downloaded‏ 
تحتاجه هذه الدراسة هو التنبيه على البيانات الملازمة للصورة والمعبرة lgie‏ حيث 
تؤثر هذه البيانات في تزويد وتكشيف واستدعاء الصورة داخل محركات بحث 
الصور التي تعتمد كلية على الحقول المصاحبة للصور الرقمية؛ مثل حقل الكلمات 
المفتاحية. والعنوان. نوع وشكل الصورة. ووصف الصورة ... إلخ. 


Notess, Gerg R. op cit. p3. (9) 
Image Tagging: Embedding Metadata In Image Files. (Y) 
TASI Technical Advisory Service for Images, 2003, visited at 28/4/2003, 
http://www.tasi.ac.uk/advice/delivering/faqtagging.html 
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ولقد خرجت الأنواع السابقة من ملفات الصور الرقمية بالشكل الذي تفارق 
فيه الصورة حقول البيانات - المحدودة - المصاحبة لها عند نسخ أو تحميل هذه 
الصورةء مما يؤثر بدوره على تحويل ماهية الصورة واختلاف البيانات المعبرة 
عنها. ويمكن تمثيل المعنى السابق بمجموعة الصور داخل حافظة واحدة وبجانب 
كل صورة يتم وضع البيانات المعبرة عنها مثل تاريخ إنتاج الصورة أو المصور أو 
المكان. وعلى ذلك يتضح محتوى الصورة اينما ذهبت. وتعد فواعد بيانات الصور 
الرقمية الآنية على هذا النحو من العمل حين تضع حقول البيانات الواصفة فقط 
كشي ulace p‏ الک الركسة ss‏ فاعدة slbi‏ ف 

ويمكن إرجاع الحاجة لوصف ملفات الصور بحقول البيانات Tagging‏ إلى أن 
مختلف البرامج التي تعمل على ملفات الصور لا تتوافق في فتح ملفات الصور مما 
ألزم مصممي هذه الملفات إلى إيجاد صيغة توافق مختلف البرامج والتطبيقات 
الخاصة بالصور الرفمية. 

ويحتلف حجم حقول البيانات المصاحية لملفات الصور بحسب انجاه 
استخدام فاعدة البيانات. بحيث إذا كانت قاعدة البيانات لا يحتاج مستخدموها إلى 
الحقول الكثيرة؛ فان الملفات التي تأخذ متوسط مساحة أقل هي الأكثر كفاية عن 
الملفات الأخرى. أما إذا كانت قاعدة البيانات تخدم مستفيدين ذوي طابع خاص 
فانه من اللازم توافر حجم أكبر من الحقول ذات الخصائص الأكثر تفصيلا عن 
gull‏ على انه في كل الحالات فانه لابد من agag‏ عدد من الحقول المعيارية يعبر 
عن ماهية الصورة الشكلية والموضوعية. 
۲ الصيغ المعيارية لوصف الصور الرقمية 

لقد كان لتباين الاختلافات في الوصف المادي للصور. ومشكلات التحليل 
الموضوعي لها أن اتجهت الكثير من المنظمات المتخصصة في مجال المعلومات 
وغير المتخصصة على أن تصنع معايير ومواصفات ثابتة يمكن من خلالها التحكم 
الببليوجرافي والمعلوماتي في أوعية معلومات الصور. وهو ما يعتبر خطوات واسعة 
في طريق الاهتمام بنظم استرجاع الصور وتحقيق أعلى معدلات من الدقة والكفاية 
في استدعاء معلومات الصور . 


Graham, Margaret E. THE DESCRIPTION AND INDEXING OF IMAGES: (*) 
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ولقد عمل المسح الذي أجراه معهد أبحاث البيانات المصورة Institute for‏ 
(OI MAGE DATA Research‏ على إظهار الاستخدام الحقيقي لمعايير وصف الصور 
داخل المكتبات التقليدية. وقد جاءت النتائج في صالح استخدام معايير وصف 
ببليوجرافي يتم إعدادها داخل المكتبة والملائمة لطبيعة استخدام المكتبة 
والمستفيدين لمجموعاتها من الصور الفوتوغرافية؛ حيث كانت نسبة وصف 
الصور الفوتوغرافية بمعايير وصف داخلية هي AV)‏ ويلي ذلك قواعد الفهرسة 
الأنجلو أمريكية AACR2‏ بنسبة ۲١‏ ثم قواعد الفهرسة المقروءة آليا MARC‏ بنسبة 
۷ ويوضح الجدول رقم (Y-Y)‏ أنواع ونسب استخدام قواعد الوصف 
الببليوجرافي للصور داخل المكتبات موضحًا معايير الأنواع الأخرى من المواد 
غير النصية:- 


الجدول رقم (Y-Y)‏ 
يوضح مراتب استخدام معايير الوصف الببليوجرافي للصور داخل المكتبات 


In- VRA (Visual | Metadata - Cataloguing 
Other house SPECTRUM Resources Dublin MARC | AACR | No.* standard: 
rules Association) Core Type of Material: 
yA | XNY /Y 7i AY 4A | xo | oy | (35 mm) الشرائح‎ 
— لا — — — — —]1— - —1— — ا د‎ — —— 
ZY | Y> yY | - | - | ه15‎ 1/3 | tb j الفيديو‎ 
ا‎ | TA السك ال‎ S. l E es 
BE | ww | 7 Yt | = | Xx AYO | Yt | الصور الفوتوغرافية‎ 
| | 
| (positives) 
} 1 1 - : 
7.0 4M 0 | 10 = | X IX ۱۹ الصور الفوتوغرافية‎ 
(negatives) 
H + + / 4 4 » 
7A wee 7A 73 | = | on ANA Yv | الملصقات‎ 
| | l 1 | 
rA Z14 JN | - - XY An! M | المطبوعات‎ 
| | | | 
ZA 2 A^ | - - yv bum | wv اللوحات‎ 
| 
ZA a 4^ | ZA - XN yyy | yY الرسومات‎ 
+ + + 
AES 2/10 74 205 - 7^ JNA M (5"x4") الشفافيات‎ 
5 | 1 | | 4 
/ | 40 ZW - - ANY | ۸ ^ لوحات القماش‎ 
} 1 + 
| Zt ov A | = - AE AXA 7 الأفلام‎ 
1 
yY- yi - - - - | VAR 0 المنتجات الفنية‎ 


Report of a survey of ARLIS members, Institute for IMAGE DATA Research1998/99, (1) 
visited at 6/10/2003, http://www.unn.ac.uk/iidr/ARLIS/. 
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ويلاحظ الباحث أن أحدًا من أفراد المسح لم يشر إلى استخدام معيار 
Metadata - Dublin Core‏ في الوصف الببليوجرافي للصورء وذلك إنما qiu‏ من ندرة 
في التفاعل بين مجموعات الصور داخل المكتبات التقليدية وبيئّة الويب. ومن ثم 
التعرف إلى أكثرها ملاءمة لتلك البيئة. 
1 معيار NISO‏ 


«National Information Standards Organization (NISO) وضع هذا المعيار منظمة‎ 

وهي من المنظمات غير الهادفة للربح قام بتأسيسها المعهد القومي الأمريكي 
للتقييس American National Standards Institute‏ وتعرف اختصارا باسم ANSI‏ عام 
8م ثم تفير اسمها إلى الاسم الحالي وذلك بغرض رعاية وصيانة وإنتاج المعايير 
اللازمة لمجال المعلومات. ومن أهم المعايير التي قدمتها هذه المنظمة هي ANSI/‏ 
NISO 239.7 - 1995 Library Statistics, ANSI/NISO 12083 - 1995 (R2002) Electronic‏ 
Manuscript Preparation and Markup, ANSI/NISO Z39.14 - 1997 (R2002) Guidelines for‏ 


Abstracts, ANSI/NISO Z39.50 - 1995 Information Retrieval : Application Service Definition & 
محاور معيار الصور حول عملية الوصف والتعبير عن‎ 9159 Protocol Specification 
e ale شن‎ ala اننهت انو الأخيرة‎ ay النحتوئ:الموضوعى :لها‎ 

01635 Specifications معيار‎ 


4414 وهي‎ «International Imaging Industry Association 441 وضع هذا المعيار‎ 

تجمع بين مجموعة من الشركات العاملة في مجال إنتاج الصور الرقمية مثل Canon,‏ 
...Agfa, Kodak‏ وغيرها. ويحتوي المعيار على مجموعة من الحقول الموحدة 
المستخدمة لوصف الصور الرفمية ويرمز له ب 138 لتمثيل اسم الجهة القائمة على 
بنائه. وكان أول إصدار لهذا المعيار في الثامن عشر من يونيو عام ١١٠٠م‏ وذلك 
بإخراج الإصدارة Y,‏ ثم يلي ذلك خروج الإصدارة ١,١‏ والتي تعمل بالتوافق مع 
ترميز لفة الترميز المعيارية القابلة للتوسع :XMLTags‏ وذلك لما لهذه اللغة من قدرة 
على توفير البيئة الملائمة لعمل حقول الوصف الميتاداتا وصلاحيتها لاستدعاء 


About NISO, niso, 2001, visited at 20/9/2002, (*) 
http://www.niso.org/about/index.html 
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الصور الرقمية وعرضها بشكل فردي. ولقد حرصت هيئة الإصدار على بناء هذا 
المعيار بالشكل الذي يمكن معه مواجهة صعوبات التعامل مع ملفات الصور الرقمية 
وتنظيمها واسترجاعها. وهي الصعوبات التي أخذت في التزايد مع انطلاق عمل 
محركات بحث الصور في تنظيم وبحث الصور. كما عملت هيئة إصدار هذا المعيار 
على صيانته في إصداراته المختلفة ليتوافق مع المعايير الأخرى مثل ISO's JPEG-‏ 
and MPEG-7‏ 2000( بالإضافة إلى متابعة التحديث في لغة XML‏ ونغات التركيز 


المعيارية الأخرى'. 


VRA3 مهيار‎ 1 


the Visual Resorce Association Core categories v3 (VRA 3) يتناول هذا المعيار‎ 

ويبلغ عدد عناصره ١7‏ عنصرًا ترتكز على أوعية المعلومات المصورة غير أنها 
ليست في نفس تعقيد معيار مارك .Machne Readable Cataloguing (MARC)‏ وتتعدى 
عناصر وصف هذا المعيار أوعية الصور الثابتة الرقمية إلى مختف المعلومات 
المرئية الأخرى مثل فنون الرسم على الجدران وفنون الأشكال الهندمية إلى الصور 


0 
i المطبوعة‎ 


Metadata for Long term Preservation معيار‎ 


وضع هذا المعيار The Neworked European Deposit Library (NEDLIB)‏ وعرف 
بأسم Metadata for Long term Preservation‏ ويتعلق بالعناصر والحقول الجوهرية 
المستخدمة في وصف المصادر الإلكترونية وخاصة الصور التي يتم حفظها لأمد 
طويل وجاء المعيار مركزا على ثمانية عناصر رئيسة وثمانية وثلاثين عنصرًا 
فرعيًا . 
ويوازي مصطلح الميتاداتا هنا عملية الوصف الببليوجرافي .اخل المكتبات 
التي تعمل على وضع حقول لوصف شكل ومحتوى المادة داخل الكتبات. ويعد 
استخدام مصطلح الميتاداتا مصطاحًا عامًا إذا ما أردنا به الحديث عن البيانات أو 


01035: Metadaa Standard for Digital Images. XMLCoverPages, 2002, (9) 


visited at 21/6/004, http://xml.coverpages.org/dig35.html 
Metadata: Imae Description, Indexing and Cataloguing. tasi, 2004, (Y) 


visited at 21/6/004, http://www.tasi.ac.uk/advice/delivering/meta.html 


— VA. — 


الحقول الواصفة المادة داخل dis‏ الويب؛ حيث تستخدم حقول الميتاداتا على 

2 ترات‎ BIG ف‎ la Lnd JST algae 

daa أي الملفات النصية‎ htm! استخدام حقول الميتاداتا لوصف ملفات‎ : Fyi 
بيئّة الويب.‎ Jal 

lob‏ : استخدام الحقول الميتاداتا لوصف الملفات غير النصية المصاحبة 
لصفحات الويب مثل ملفات الصوت والصورة والفيديو. 

re‏ : استخدام حقول الميتاداتا لوصف الملفات التي توجد داخل مختلف قواعد 
البيانات على الويب والتي تلائم استخدام تلك القاعدة دون غيرها كالتي 
يتم العمل بها داخل محركات البحث أو غيرها. 


لقد ذكر DiannRusch-Feja‏ أن هناك ثلاثة أشكال تتخذها حقول الميتاداتا 
و dea J‏ 


عتدما ترفق بمصادر المعلومات لبناء الوصف الببليوجرافي وهي كما يلي :- 


١‏ - صياغة حقول البيانات الخلفية كحقل «META Tags»‏ داخل الجزء الأعلى من 
صفحات اللغة المعيارية HTML‏ 

Y‏ - صياغة حقول البيانات الخلفية كملف منفصل » ...= «META‏ عن صفحة الويب 
لوصف الملفات التي تصحب صفحات الويب وليست جزءًا منها Jie‏ ملفات 
الصور الرقمية والصوت والملفات التنفيذية. 

Y‏ - صياغة البيانات الخلفية كجزء مكون لقاعدة البيانات التابعة لأحد خادمات 
الويب أو لأحد محركات البحث على الويب والتي تتميز باستقلالها في البناء 
عن غيرها من البيانات داخل قواعد البيانات الأخرى. 

Dublin core معيار 1:3( كور‎ 5 

تم الاتفاق على إصدار هذا المعيار في عام ١۱۹۹م‏ في مدينة دبلن Dublin‏ 

في ولاية Ohio galas!‏ بين مجموعة من الهيئات المنتشرة في مختلف الدول مثل 

Rusch-Feja, Diann. Metadata: Standards for Retrieving WWW Documents (and (1) 
Other Digitized and Non-Digitized Resources), Astronomical Society of the Pacific, 


1998, visited at 2003, http://www.eso.org/gen-fac/libraries/lisa3/ruschfejad.html 
ibid. (Y) 


—AN — 


إنجلترا وأستراليا وكندا واليابان وألمانيا وغيرها من الدول. وقد استخدمت 
الهيئات غير الرسمية القائمة على تطوير وتحديث بيئة الويب المايير المختلفة 
الداعمة لحقول مثل دبلن كور والتي تم تطويرها في اللغة المعياريا الجديدة XML‏ 
ويقترح الباحث استخدام هذه التحديثات في حقول Line‏ لدعمملفات الصور 
(المستوى الثاني للاستخدام) في بناء تسجيلة معيارية للصور الرهمةء كما ela‏ في 


معيار دبلن كور على النحو التالي :- C‏ 


الجدول رقم (Y-Y)‏ حقول الميتاداتا لوصف ملفات الصور لرقمية 


Author, Creator 


Subject, Keyword 


Annotation, Abstract, etc. 


Publisher (Person or Institution) 


Contributing Person or Institution 


Date (see separate list of Sub-Elements "DC. Date") 


Resource Type (according to a list of accepted terms) 


Format, File Type, also Physical Medium 


Resource Identification: URL, URN, ISBN, etc. 


Resource (physical, digital) from which the current resource 


was derived, digitized, etc. 


Language of the Resource 


Relationship to other Works 


Geographic or Temporal Coverage 


| Rights Management Statement (or Link to), 


DC. Descriptio 


DC. Identifier 


DC. Rights Cpy- 


E 


DC. Creator 


DC. Subject 


DC. Publisher 


DC. Contributo 


DC. Date 
DC. Type 


DC. Format 


DC. Source 


DC. Language 


DC. Relation 


DC. Coverage 


right 


و يمكن أن تكون المعايير المستخدمة الملائمة لبيئة اللغة لعربية من هذا 


المعيار هي:- 


ibid. (1) 


—NYA — 


الجدول رقم (£-Y)‏ 


حقول الميتاداتا لوصف ملفات الصور الرقمية للمصادر العربية 


.DC‏ محدد المصدر 


assis lie العنوان‎ .DC 

.DC‏ المنشيٌ | الفنان, المصور (المؤلف) 

.DC‏ الموضوع الموضوع أو الكلمة المفتاحية 

.DC‏ الوصف المحتوى و المستخلص للموضوع 

.DC‏ الناشر الناشر الفرد أو المؤسسة" 

.DC‏ المشارك 1 الهيئة أو الفرد المشارك 

.DC‏ التاريخ التاريخ و هناك قائمة منفصلة لعناصر متعددة في التاريخ 
.DC‏ النوع | نوع المصدر طبقا للقائمة المحددة" 

.DC‏ الشكل 


الشكل. نوع الملف الرفمي.الوسيط المادي 


محدد المصدر و قد يكون مسار الملف. الرقم الدولي الموحد...' 


DC‏ المصدر المصدر رقمي. تقليدي الذي اشتق منه الملف الرقمي الحالي 
.DC‏ اللغة n"‏ لغة المصدر 

.DC‏ العلاقات العلاقات الببليوجرافية مع الأعمال الأخرى 

.DC‏ التفطية التفطية المكانية أو الزمنية للمصدر 

.DC‏ حقوق النشر الحقوق المنظمة لنشر وتحميل المصدر 


وحري SUL‏ هنا أن المعيار المقترح السابق الذكر لإنتاج وإخراج ملفات 
الصور الرقمية على الويب يعمل على تغيير نمط التعامل بين محركات البحث 
وملفات الصور من الشكل غير المقنن إلى الشكل المقنن؛ مما ينتج عنه اختلاف 
في طبيعة المعالجة الفنية لملفات الصور من حقول تابعة لصفحات الويب غير 
منظمة إلى حقول محددة يمكن معها بناء معيار ثابت لتحرك برنامج الزاحف 
والمكشف في التعامل مع ملفات الصور على الويب. ويمكن متابعة ذلك كما سيلي 
في معالجة وبحث الصور الرقمية داخل محركات البحث في الفصول القادمة. 
1 مهيار RGL‏ 


وضع هذا المعيار مجموعة المكتبات البحثية Research Group Libraries (RGL)‏ 


— Ava — 


عام ۱۹۹۸ء وعرف .RGL Preservation Metadata Elements eL,‏ وتم بناء هذا المعيار 


اعتمادًا على العناصر الأساسية لمعيار C Dublin Core‏ 


والجدير بالذكر أن كل هذه المعايير مازالت في مرحلة التجربةء وتتكون 
هذه المعايير من ثلاثة أجزاء رئيسة هي معلومات عن ملف الصورة ومحتوى 
الصورة والكيفية التي خرجت على أثرها الصورة. ويرى الباحث أن معياري 
الميتاداتا - دبلن كور هما أفضل المعايير في وصف الملفات الرقمية للصور» وسوف 
يتم دراسة عناصره مشروحة في وصف عناصر الصورة المادية والموضوعية في 
الفصل الثالث. 

۲ عناصر محورية في وصف الصور الرقمية 

أكد Michael Day‏ أهمية وصف جوانب محددة في صياغة معايير وصف 
ata‏ تالكر aste n ib‏ ا علب هذه الجوانب بإدارة الحاسب الآلي لملفات 
الصور إلى جانب ما يخص مستخدم هذه الملفات. ومنها:- ° 

۲ المعلومات الفنية التي تتعلق بعرض الصور الرقمية : حيث تذكر 
نوع ملف الصورة. مدى عمق الصورة وكثافتها إلى جانب الشكل التقني للصورة 
سواء کان GIF.)‏ 165).. أو غيرها. 

5 المعلومات حول بناء الصورة الرقمي : حيث تذكر جوانب حجم 
ملف الصورة. ومجهز الصورة provider‏ ونوع الماسح الضوئي scanner‏ والأبعاد داخل 
الصورة. 

۲ المعلومات حول دقة وجودة الصورة الرقمية: حيث يذكر 
المسئول عن رقمنة الصورة digitization‏ ومثال ذلك (صور رقمية تحت رعاية 
المتحف المصري) أو بواسطة شخص غير تابع لهيئة. 

۲ المعلومات عن الصورة الأصلية : حيث تذكر المعلومات عن 
مصدر الصورة وطبيعته. ويمكن أن تحتوي هذه العناصر على وصف سابق أو 
تصنيف موضوعي للصورة الأصلية. 


Metadata: Image Description, Indexing and Cataloguing. op.ct. (*) 


Day,Michael. Metadata for images: emerging practice and standards, UKOLN: The (v) 
UK Office for Library and Information Networking, 1999, visited at 12/2/2004, 
http://www.ukoln.ac.uk/metadata/presentations/cir99/paper.html 


DOM Ln 


۲۷ المعلومات حول توثيق الصور i‏ حيث يسترجع مستخدمو الصور 
المئات من ملفات الصور بسهولة ويسر؛ إلا أنهم في الوقت ذاته غير واثقين من 
خلو الصورة من التفيرات أو التعديلات غير المسئولة. ويمكن التغلب على هذه 
المشكلة من خلال استخدام تقنيات حق النشر مثل العلامات المائية داخل ملفات 
الصور. 

۲ المعلومات حول حقوق النشر : تفيد هذه المعلومات في التعامل 
مع ملفات الصور أكثر من مرة. وتحفظ هذه المعلومات حقوق الاستخدام سواء 
للناشر أو لمنتج الصورة الرقمية. 

ويقترح Howard Besser‏ أن تكون جوانب الوصف السابقة محورية في إنتاج 
معايير المعالجة الفنية للصور الرقمية في مختلف انواعها. و اشكال ملفاتها. 


Aue Mant! o/Y 
تختلف تطبيقات الصور الرقمية بحسب كل من مجال الاستخدام وتقنيات أو‎ 
أماكن الاستخدام» كما وضح ذلك في استخدامات الأغراض البحثية و العلمية‎ 
والتاريخية الثقافية إلى الفضائية وصور وكالة ناسا. أيضا هناك استخدامات الصور‎ 
في مجالات التسويق و العروض الفنية إلى جانب تصميم صفحات الويب. وتقع‎ 
الصور الرقمية الطبيعية كورقة من فرع من شجرة وسائط حمل المعلومات المرئية‎ 
وإنما‎ Barge بصفة عامة. وبالإضافة إلى ذلك فإن أشكال الصور الرقمية ليست‎ 
تتباين بحسب التقنيات المستخدمة في إنشاء ملفات الصور الرقمية على الويب. و‎ 
قد عمل هذا الفصل أيضا على استعراض المعايير المستخدمة للمعالجة الفنية‎ 

لصور الويب» مع التمهيد للتركيز على أفضلها في الفصل التالي من الدراسة. 


9. e. 
A od کړه‎ 


e. 
کړه‎ 


-——— — 


الفصل الثالث 


٠/۳‏ التمهيد 
۳ الوصف المادي والموضوعي للصور الرقمية 
۳ معالجة اللغة العربية في نظام استرجاع الصور 
Aue Ast! Y/Y‏ 


9 e. 0 
“ “~~ کړه‎ 


معالجة الصور 


۳ التمهيد 

تحتاج الصو الرفمية في بيئة الويب إلى مجموعة من polic‏ الوصف 
الفني المادي والموضوعي التي تلائم التعامل مع ملفات الصور الرقمية. وتؤثر 
عملية الوصف الفتي للصور الرقمية في أساليب التنظيم والممالجة التي يتوقف 
عليها استدعاء وبحث الصور الرقمية داخل محركات بحث الويب و المحركات 
المحددة. و لكن إلى أي مدى قد تعاملت الدراسات مع المعالجة الفنية للصور 
الرقمية. وكيف يمكن الخروج بالتسجيلة الببليوجرافية الملائمة لملفات الصور 
الرفمية على الويب. 


۳ الوصف المادي والموضوعي للصور الرقمية 
۱/۱/۳ الوصف المادي للصور الفوتوغرافية الرقمية 

إن الحديث عن المكونات المادية للصورة جاء نتيجة الحاجة لوصف هذه 
الصورة وصقًا ببليوجرافيًاء ذلك إنما ينقسم هذا الوصف الببليوجرافي إلى الشقين 
الأساسيين وهما المادي والموضوعي. والأمر يختلف بين وصف مادة الصورة في 
البيئة التقليدية وعنها في البيئة الرقمية حيث تفرض JS‏ منها عناصر تلائم 
خصائص الاسترجاع فيها. فمثلا تفرض البيئة الرقمية الحديث عن نوع الملف GIF,‏ 
266,6 ... إلخ» كما أن التسجيلة في البيئة التقليدية تختلف عن التسجيلة في 
البيئة الرقمية؛ فالأولى لا يتم الاسترجاع فيها إلا بالمدخل الذي رتبت على أثره 
بطاقة الوصف الببليوجرافي الذي يكون في أغلب الأحيان مدخل المؤلف أو العنوان. 
أما الأخيرة فيمكن أن تسترجع بكل عناصر التسجيلة. 


— Mo — 


واعتمادًا على أن الصورة يتم تخزينها وعرضها في البيئة الرقمية. فإن 
عناصر وصف تسجيلات الصور تأتي من كل عناصر ملفات الصور مثل حجم 
الملف. وألوان الصورة. وشكل الصورة داخل الملف. وقد أوضح Jack Christine‏ أن 
هذه العناصر مع غيرها مثل المصورء والزمن الذي التقطت فيه الصورة؛ ومالك 
الصورة» والبنية الرقمية التي وضعت بها الصورة» كل ذلك يمكن أن يشكل التسجيلة 
الكامة لوست وسيل الصدورة اوو اة ٠‏ كل ذلك فشكن العف عن ij‏ 
بألوان الزيت رسمها ليوناردو دافنشي إذا ما تم تحديد تاريخ الصورة ونوع الألوان 
ومكان الوجود بالإضافة إلى موضوع هذه اللوحة والتي يشكل الموضوع فيها اهم 

وتسمى العناصر السابقة التي caua‏ الصورة كما أشرنا في الفصل الثاني 
باسم الميتاداتاء وتعمل هذه العناصر عمل النص المساعد في استرجاع الصورة 
المكونة من حقول وكلمات مفتاحية ومسار موقع الملف في حالة صور الويب. 
بالإضافة إلى امتداد الملف الذي يوجد في نهاية مسار ملفات الصورء هذا ما 
تستند إليه محركات البحث في حالة البحث عن ملفات الصور. وتختلف طبيعة 
المعايير في التسجيلات الرقمية عنها في التسجيلات التقليدية حيث لا يمتد الأمر 
في التسجيلات الرقمية إلى الأبعاد بين الحقول أو علامات الفصل بين الحقول وما 
إلى ذلك من روابط بين الحقول. فالأمر لا يتعدى اختيار الحقول التي ستوضع في 
التسجيلة والعناصر التي تمثل هذا الوسيط. وهذا هو ما توجد عليه النظم الآلية 
الحالية في مجال المكتبات . 

ولقد افترح Jane Hunter‏ نظامًا لاسترجاع الصور يعتمد على تكشيف الصور 
الصور الرفمية PNG 5A‏ )7( وهذا النظام فد تم صياغته وتحديد معايير مصطلحاته 
عن طريق مجموعة العمل لمنظمة „Dublin Core Metadata Initiative (DCMI)‏ وقد 


Cristine, Jake. stat of the arts: current applications for indexing images, the author, (1) 

1999, visited at 23/9/2002, http://portal.acm.org/citation.cfm?id=614788 

Hunter, Jane, op.cit., p.10 (Y) 

(Y)‏ هذه إحدى المنظمات في المملكة المتحدة والتي تعمل في مجال استرجاع مصادر المعلومات على الويب. 

ذلك من خلال صياغة النظم المثلى في استرجاع المصادر بالإضافة إلى صياغة المعايير اللازمة 
لتحقيق افضل slal‏ لاسترجاع المعلومات. ويمكن الرجوع إلى موقع المنظمة http://uk.dublincore.org/‏ 


— 2 كك 


وضع Hunter‏ في هذا الوصف حقولا معيارية للوصف الببليوجرافي للصور. ويرى 
الباحث أن هذه الحقول قد جمعت كل ما يمكن أن يوجد في الصور من سمات 
مادية يمكن استرجاع الصورة الفوتوغرافية من خلالها. والجدير بالذكر هنا أن 
هذه التسجيلة لا تلائم سوى الصور الفوتوغرافية وليس كل اشكال المادة المصورة 
التي تندرج تحت مصطلح (Image)‏ وهذه الحقول كما toh‏ 


الجدول رقم )1-1( التسجيلة الإنجليزية للصور الرقمية في المستوى الأول 


Top Level Metadata Description for Complete Image 


Title A selector and his family, probably in the Beenleigh district, 1872 
Creator William Boag 
3 

Subject Photograph collection - Queensland 

Description The difficulties faced by a family in the Queensland bush in- 
cluded poor roads, an unreliable mail service and dense, vine- 
matted scrub. For many years, a selector's staple diet was 
salted meat (salt horse) and pumpkins. For several months, a 
woman and her children might be alone in their stringy-bark 
hut while her husband went off to split shingles or to earn extra 
money on 3 cattle property. 

Date.created 1872 

Date.recordCreated 1996 

Date.placedOnline 1997 

Publisher State Library of Queensland 

Type q image.photograph 

Format image/jpg 

pa 

Format.fileSize 50.6Kb | 

Format.dimensions 672 x 512 

Format.colorpalette Grayscale 

Identifier http: //archive.dstc.edu.au/RDU/SLQ/boag/20248.jpg 

Source BOAG negative no. 906 

Language En 

Relation.isPartOf http://www.slq.qld.gov.au/jol/boag.htm 

Relation.hasParts Region1 


Relation.hasFormat http://archive.dstc.edu.au/RDU/SLQ/boag/20248. gif 


Coverage Beenleigh region, Queensland, 1872 


Rights http://www.slq.qld.gov.au/cright.htm 


—MWN — 


الجدول رقم (Y-Y)‏ التسجيلة الإنجليزية للصور الرقمية في المستوى الثاني 


Identifier Regioni 

Title Annie Dickson 

Description Wife of James Dickson and mother to their 13 children. 
495,207,546,263 

ا 

http: //archive.dstc.edu.au/RDU/SLQ/boag/20248.jpg 


Secondary Level Metadata for 1 


Coverage.rect 
Relation.isPartOf 


ويرى الباحث أن شكل التسجيلة السابقة يمكن أن يستخدم في البيئة العربية 


بالشكل التالي :- 


الجدول رقم (Y-Y)‏ التسجيلة العربية للصور الرقمية في المستوى الأول 


المئوان 


تاریخ الإنشاء 
تاريخ إنشاء التسجيلة 


تاريخ التحميل على 
الخط المباشر 


William Boag 


رجل وصائلته في متاملمة Boonloigh‏ في عام ۱۸۷۲ 


مجموعات صور- كوينزلاند 

بعض من الصعوبات التي تواجه العائلة و منها الطرق غير الجيدة 
بالأضاقة إلى 'الخدماتالسيكة للبريد.والمبيشة: ley‏ الزوجةو 
أولادها انتظار الأب لإحضار بعض المال. 

AVY 


VAN 


۹4۷ 


مكتبة ولاية كوينزلاند 
صورة فوتوغرافية 
صورة من نوع ومز 
50.6Kb‏ 


672x512 


اللون الرمادي 
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تابع - 


محدد المصدر الموحد 


مسار العلاقة من الصفحة 


المصدر الفيلم السالب رقم ٠٠٦‏ 

اللغة الإنجليزية 

العلاقة الببليوجرافية http://www.slq.qld.gov.au/jol/boag.htm‏ جزء من صفحة 
نوع العلاقة 1 1علاقة أولية 


http://archive.dstc.edu.au/RDU/SLQ/boag/20248.gif 3 


الجدول رقم (T-Y)‏ التسجيلة العربية للصور الرقمية في المستوى الأول 


http: //archive.dstc.edu.au/RDU/SLQ/boag/20248.jpg 


التفطية و مقاطعة Queensland, 1872 4Y; Beenleigh‏ 
حقوق النشر http://www.slq.qld.gov.au/cright.htm‏ 

الجدول رقم (£-Y)‏ المسنوى الثانى وصف اللغة العربية 
المحدد Regioni‏ 
العنوان Annie Dickson‏ 
الوصف زوجة ل James Dickson‏ و أم Ww.‏ طفلد 

L 

رقم التفطية في المكتبة 2 | 495,207,546,263 
العلاقة الببليوجرافية http: //archive.dstc.edu.au/RDU/SLQ/boag/20248.jpg‏ 


“/1// خصائص التسجيلة في معيار الميتاداتا 
تمثل عناصر التسجيلة السابقة مواصفات واحدة من مجموعة صورء وما 
يمكن الحديث عنه هنا هو حقول هذه الصورة التي تشكل كل عناصر وصف 
الصورة وملفات صور الويب في المستوى الكامل للوصف الببليوجرافي» ويمكن هنا 
تناول العناصر السابقة بالشرح فيما يخص آليات استرجاع الصور وما تسهم به 
هذه العناصر في وصف الصورة واسترجاعها في مستواها الأول على النحو 
التالي:- 
Yai‏ : أن كل العناصر السابقة تصف الشكل المادي للصورة وللملف Jala‏ قاعدة 
البيانات؛ إلا أن التسجيلة قد شملت ضمن ما شملت من عناصر حقل 
Description.‏ ويعنى هذا الحقل بوصف المحتوى الموضوعي للصورة. وفد 


— WA — 


ثانيًا 


t 


last 


لاحظ الباحث أن الوصف هنا لم يكن في كلمات مفتاحية منفردة وإنما 
جاء الوصف في شكل ملخص Summary‏ يحتوي على وصف الموضوع 
والعناصر المادية والموضوعية داخل الصورة. وهذا يتوافق مع ما سبق 
ذكره من صعوبة تفيير لغة الصورة إلى لغة نص وتحويل الرؤية إلى كلمات 
تكون هي الأكثر دلالة على الموضوع. كما أن هذا أيضا يتوافق مع طبيعة 
العنصر البشري في وصف محتوى المادة المصورة. 


: لقد تم وضع حقل الموضوع ‘Subject‏ إلا أن E‏ الموضوع لم يكن لما هو 


بداخل الصورة وإنما لتحديد الصورة في إطارها العام حيث يذكر 
"Subject: Photograph collection - Queensland"‏ ويرى الباحث أن هذا الحقل 
لما هو بداخل الصورة وليس لما تقع الصورة بداخله. حيث يأتي رأس 
الموضوع المعبر عن الصورة ( الحياة الأسرية) أو الأبناء ‏ رعاية... الخ. 


: لقد ذكر معيار الوصف هنا ثلاثة أنواع من تاريخ الوسيط هي تاريخ 


الإنتاج» وتاريخ الوصف. وتاريخ الإتاحة على الخط المباشر؛ إلا أن أهم 
هذه التواريخ هي تاريخ الإنتاج ذلك لأن بعض الباحثين قد يهمهم بالدرجة 
الأولى الملامح التاريخية لهذه الفترة المتمثلة في محتويات الصورة. 


: إن الحديث عن الوصف المادي Y‏ يكون هنا عن الصورة Lalo‏ الحديث 


عن الملف الإلكتروني الذي يحتوي الصورة. وذلك في إعطاء نوع الملف 
وحجم الملف ومكان وجود هذا الملف على الخط المباشر أو في الويب. 
وكل هذه البيانات وإن كانت تفيد الباحث في الوصول إلى الصور التي 
يريدها؛ إلا أنها تهم بالدرجة الأولى محركات بحث الصور؛ ذلك لأن 
محرك البحث يبحث داخل كل ملفات الويب عن هذا النوع من الملفات 
قبل أن تكون متاحة للباحثين. وعلى ذلك oja‏ النظر هنا يكون إلى برامج 
الزحف الآلية 9 التي تقوم بافتناء وإضافة ملفات الصور إلى 
قواعد بيانات محركات البحث. 


: يأتي الجزء الخاص بحماية الملكية الفكرية والنشر عن طريق ذكر موقع 


أو صفحة المجموعة المصورة التي تنتمي إليها هده الصورة. slag‏ وجود 
هذا الحقل في تسجيلة الصورة نتيجة للكتابات الكثيرة التي تناولت حق 


ha. 


الملكية للصورء ويعد هذا أيضًا نابعًا من الوجهة التجارية التي نشأت بها 
قواعد بيانات الصور ومحركات الصور Lda!‏ 
سادسًا : تساعد عناصر التغطية اللفوية والجغرافية بذكر المنطقة التي تضمها 
الصورة واللغة التي وصفت بها الصورة في تعدد استخدامات الصورة: 
وليس فقط الاستخدام العام لها أو الفني. 
Lal‏ المستوى الثاني من الوصف الببليوجرافي للصور فيقترح الباحث أن 
يصاحب الصورة عند عرض جميع النتائج التي تم استرجاعها من كل نظام 
الاسترجاع حيث يمكن أن يكون له التأثير في ترجيح مجموعة من الصور عن 
الأخرى» وذلك بخلاف المستوى الأول للوصف الذي هو بمثابة التسجيلة 
الكاملة لتحليل الصورة ماديًا „e gagag‏ 
و قد وضع Liag Garry Forger‏ لعناصر تسجيلة Dublin Core‏ تتضمن مصادر 


انات الحعوك ونا عبرم كنا لي 


الجدول رقم (e-Y)‏ 
التسجيلة الكاملة الأجنبية للصورة الرقمية العامة في بيئة الويب 


ELEMENT DESCRIPTION 
TITLE The name given to the resource by the CREATOR or PUBLISHER. 
CREATOR The person(s) or organization(s) primarily responsible for the intellectual 


content of the resource. For example, authors in the case of written docu- 
ments, artists, photographers, or illustrators in the case of visual re- 
sources. 

SUBJECT The topic of the resource, or keywords or phrases that describe the sub- 
ject or content of the resource. The intent of the specification of this ele- 
ment is to promote the use of controlled vocabularies and keywords. This 
element might well include scheme-qualified classification data (for ex- 
ample, Library of Congress Classification Numbers or Dewey Decimal 
numbers) or scheme-qualified controlled vocabularies (such as MEdical 
Subject Headings or Art and Architecture Thesaurus descriptors) as well. 
DESCRIPTION A textual description of the content of the resource, including abstracts in 
the case of document-like objects or content descriptions in the case of 
visual resources. 

PUBLISHER The entity responsible for making the resource available in its present 
form, such as a publisher, a university department, or a corporate entity. 
The intent of specifying this field is to identify the entity that provides ac- 
cess to the resource. 


Forger, Garry. Image, University of Arizona Library, 2002?, visited at 5/10/2003, (1) 
http://dizzy.library.arizona.edu/sitesrch/train.html 
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تابع ‏ الجدول رقم )0-1( 


التسجيلة الكاملة الأجنبية للصورة الرقمية العامة في بيئة الويب 


DESCRIPTION 


Person(s) or organization(s) in addition to those specified in the CREATOR 
element who have made significant intellectual contributions to the re- 
source but whose contribution is secondary to the individuals or entities 
specifed in the CREATOR element (for example, editors, transcribers, il- 
lustrators, and convenors). 


The date the resource was made available in its present form. The recom- 
mended best practice is an 8 digit number in the form YYYYMMOD as de- 
fined by ANSI X3.30-1985. In this scheme, the date element for the day 
this is written would be 19961203, or Dec ember 3, 1996. Many other 
schema are possible, but if used, they should be identified in an unambig- 
uous manner. 

The category of the resource, such as home page, novel, poem, working 
paper, technical report, essay, dictionary. It is expected that RESOURCE 
TYPE will be chosen from an enumerated list of types. 

The data representation of the resource, such as JPEG or TIFF image. The | 
intent of specifying this element is to provide information necessary to al- 
low people or machines to make decisions about th e usability of the en- 
coded data (what hardware and software might be required to display or 
execute it, for example). As with RESOURCE TYPE, FORMAT will be as- 
signed from enumerated list. In principal, formats can include physical 
media such as books, serials, or other non-electronic media. 

String or number used to uniquely identify the resource. Examples for 
networked resources include cs and URNs (when implemented). Other 
globally-unique identifiers, such as International Standard Book Numbers 
(ISBN) or other formal names would also be candidates for this element. 


| The work, either print or electronic, from which this resource is derived, if 


applicable. For example, an html encoding of a Shakespearean sonnet 
might identify the paper version of the sonnet from which the electronic 
version was transcribed. 

Language(s) of the intellectual content of the resource. Where practical, 
the content of this field should coincide with the NISO Z39.53 three char- 
acter codes for written languages. 

Relationship to other resources. The intent of specifying this element is to 
provide a means to express relationships among resources that have for- 
mal relationships to others, but exist as discrete resources themselves. 
For example, images in a docume nt, chapters in a book, or items in a 
collection. A formal specification of RELATION is currently under develop- 
ment. Users and developers should understand that use of this element 
should be currently considered experimental. 

The spatial locations and temporal duration characteristic of the resource. 
Formal specification of COVERAGE is currently under development. Users 
and developers should understand that use of this element should be cur- 
rently considered experimental. 

The content of this element is intended to be a link (a URL or other suita- 
ble URI as appropriate) to a copyright notice, a rights-management 
statement, or perhaps a server that would provide such information in a 
dynamic way. The intent of specifying this field is to allow providers a 
means to associate terms and conditions or copyright statements with a 
resource or collection of resources. No assumptions should be made by 
users if such a field is empty or not present. 
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| ELEMENT 
CONTRIBUTOR 


DATE 


TYPE 


FORMAT 


IDENTIFIER 


SOURCE 


LANGUAGE 


RELATION 


COVERAGE 


RIGHTS 


العنوان 


الموضوع 


la: 


الناشر 


الموزع 


الجدول رقم )1-1( 
التسجيلة الكاملة العربية للصورة الرقمية العامة في اللغة العربية 


qc 
موجز لمحتوى‎ 
الصورة يعرض‎ 
الموضوعات‎ 

الأساسية بها 
PPP opal‏ 
المسئولة عن 
إظهار الصورة 
في الشكل الذي 

خرجت عليه 
الفرد أو الجهة 
التي تعمل على 
إيصال المحتوى 
إلى المستخدمين 


يؤخن من الأصل 


يؤخذ من الأصل 


مختلف المصادر 


beste سن‎ | 


. 
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يبدأ باسم العائلة 


Again M‏ ولاس 
d pov‏ في A‏ 
ET‏ 


اسم الفرد أو 
الهيئة الشائع 


حديقة الأزهار 


كلارك فريد 


الحرب العالمية 
الثانية العرض 
العسكري 

وز حول 
s‏ ماو ة 
ا 


لقوات الاحتلال 


(1-1) الجدول رقم‎ aati 
التسجيلة الكاملة العربية للصورة الرقمية العامة في اللغة العربية‎ 


تاريخ وضع الوسيط المكتبة الوطنية [VAVA‏ اليوم/الشهر/العام | ٠١۷۸/٠١/۲٤‏ 
في الشكل الحالي 
نوع الوسيط سواء 
صورة فوتوغرافية: 
cdd idi‏ 


الوسيط صورة فوتوغزافية. 
ملونة أو أبيض وأسود 


5 
الشكل الشكل الرقمي | من خصائص الملف GIF, JPG‏ 
لملف الصورة الرقمي وامتداد 
üii‏ 
EE‏ هو كلمة أو رمز شكل الأرقاح أو a1/vo/À‏ 
رقم الطلب التحديد الصورة داخل المختلط والهجائي 
القاعدة 
المصدر الأصلي الشكل الأصلي 
للصورة. لوحة 
أو مطبوع 
aui‏ لغة محتوى الصورة | الوسيط أو الملف ثلاثة حروف 
أو اسم اللغة 
المنطقة منطقة محتوى شبه 
الصورة الجزيرة العربية 
مساحة ملف 
الضورة edu JE‏ 
5 قوق النشر المتعلقة المكتة القومية 
حق اتشر حقوق النشر المتعلقة لمكتبة القومية 
باستخدام الصورة المصرية 
ونسخها وتحميلها 
البريد الإلكتروني البريد الإلكتروني oooo@yahoo.com‏ 
لمصور أو مالك 
الصورة 


مسار ملف الصورة موقع أو محدد 
مسار ملف الصورة www.ifla.org/conferences/leader.gif‏ 


على الويب 
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العنوان: 

الفنان. المصور (المؤلف): 

الموضوع: 

وصف الموضوع (المحتوى): 

تاريخ التقاط الصورة: 

تاريخ صنع الصورة الرفمية: 

تاريخ وضع التسجيلة: 

الناشر: 

شكل ملف الصورة: 

حجم ملف الصورة: 

15 59 wall Aui 

اللون: 

تعريف الصورة: مسار الملف: 

مصدر الصورة على الويب : في حالة محرك البحث: موضع التقاط الصورة 

من الويب. 

Ai]‏ ملف الصورة : في حالة المحركات متعددة اللغات: 

تفطية الصورة: المكان: 

حموق نشر الصورة: 

وتمثل الحقول السابقة التسجيلة المقترحة لصياغة ملف الصور Aged ME‏ 
إلى جانب الأخذ بها في تكشيف محركات البحث لملفات الصور. من خلال تعيين 
المصطلحات من Joi‏ تسجيلة ملف الصورة إلى التسجيلة داخل نظام الاسترجاع 
لمحرك البحث. 
۳ التحليل الموضوعي للصور 

تناول معيار الوصف السابق تحليل الشكل المادى للصورة. أما تحليل 
المحتوى. فانه يأخذ جانبًا آخر» حيث لا يعتمد الأمر هنا على وصف عناصر 
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وأشكال مادية يتم وصفها كما هي وإنما يعتمد على polic‏ .وضوعية (lang‏ 
يمكن أن تفهم بأكثر من زاوية لرؤية المعنى. ويسمى استرجاع اصور في الحالة 
التي لا يستخدم فيها النص باعتياره عامل استرجاع للصور باسم استرجاع 
الصور المبني على المحتوى content Based Images Retrieval (CBIR)‏ 399 ظهر هذا 
المفهوم على يد Kato‏ عام ١۱۹۹م‏ عندما بدأ العمل في اتجاه سترجاع الصور 
للصورة ويكون برنامج نظام الاسترجاع ذا خصائص تمنحه الندرة على تحليل 
مكونات الصورة الأساسية وهي اللون والشكل shape‏ والبنية E‏ ولا تدخل 
للنص هنا في الاسترجاع سواء بالوصف أو بالكلمات المفتاحية؛ إنما يعتمد فقط 
على الخصائص والأساليب الآلية الخالصة. وهذا النوع من لاسترجاع تكون 
الحاجة له حيث يكون فيه استخدام الواصفات أو النص غير الإرد مثل التعرف 
إلى بصمات شخص ما ومحاولة مطابقتها على بصمات أخرى فض قاعدة بيانات. 
أو التعرف إلى شكل فيروس أو بكتيريا غير معروفة ومطلوب مطبقتها على مواد 


أخرى شبيهة في قاعدة بيانات . 


أما استرجاع الصور المبني على النص المصاحب للصورة حيث تكون 
الصورة daas‏ جزءًا من التسجيلة فيسمى .Text Base Images Retrieval (TBIR)‏ وهذا 
هو الأنسب في استخدامه على الويب لكن هذا الجزء يساهم في الاسترجاع فقط 
بصفاته الشكلية التي تم تحويلها إلى كلمات ونص مصاحب ساء كانت كلمات 
واصفة أو عبارات واصفة أو جملا شارحه. وهذا النوع من البرامج هو ما تحاول 
هذه الدراسة العمل على إيجاد مواصفات تزيد من كفايةعملية البحث 
والاسترجاع داخله . 


وينقسم استرجاع الصور المبني على المحتوى والموضو: إلى نوعين من 
الاسترجاع. أولهما: تقسيم كل مجموعة صور في مكتبة الصور إلى موضوعات 
رئيسة ثم إلى موضوعات فرعية ثم إلى فروع الفروع وهكذا. أا الشكل الآخر 
فهو استرجاع مبني على البحث بالكلمات المفتاحية والذي من لممكن ان يكون 
في شكل واصفات منفردة أو عبارات غير متكاملة أو جمل فى شكل ملخص 


Mattison, david. mages of History on the Web. informat:ion today,inc, 2002, visited (1) 
at: 15/10/2003, :http://www.infotoday.com/searcher/may02/mattison.htm 


cw t4 


شارح لموضوع ومحتوى الصورة. وهذان النوعان هما اللذان يستخدمان في 
كما في محركات البحث. 


وقد اتجه نظر باحثي استرجاع الصور إلى زاوية أخرى مؤداها تحقيق 
التكامل بين نوعي استرجاع الصور, يأتي ذلك فيما افترحته دراسة Guojun Lu and‏ 
Ben Williams‏ في تصميم نظام متكامل لاسترجاع الصور يجمع بين استرجاع الصور 
المبني على النص واسترجاع الصور المبني على العناصر AACA I‏ ونمت فكرة 
الدراسة نتيجة لما يواجهه كلا النوعين من قصور في تحقيق الكفاية المثلى ؛ حيث 
أشار الباحثان إلى أن وصف استرجاع الصورة باستخدام النص المصاحب قد لا 
يصل إلى الحد الذي يعبر فيه المكشف عن كل معاني الصورة وموضوعاتها. بما 
ينتج dic‏ استرجاع غير دقيق للصور. وعلى الجانب الآخرء. فإن الاسترجاع 
باستخدام محتوى الصور والعناصر الشكلية والمادية للصورة ينتج dic‏ قصور في 
تحديد الموضوعات والمعاني التي تحويها الصورة. ويكون الاسترجاع هنا على نحو 
طرح الأسئلة البحثية في شكل أسئلة نصية ثم تلقي النتائج واختيار الوحدات 
المطابقة للموضوع منهاء وبعد ذلك يأتي دور الاعتماد على محتوى الصورة في 
مطابقة كل الوحدات الأخرى مع الوحدات المختارة في النتائج الأولية. والاعتماد 
على استرجاع الصور في المرحلة الثانية لا يكون إلا على اللون فقط وليس كل 
خصائص المحتوى الثلاثة (اللون والشكل والبنية) . وقد علل الباحثان ذلك بأن 
الاعتماد على الشكل والبنية يحتاج إلى معالجة ذات درجة عالية في استرجاع 
الصورء إضافة إلى أن اللون هو أكثر الخصائص المؤثرة في استرجاع الصور. وقد 
أجرى Lu‏ و Williams‏ دراسة تجريبية لاستخدام نظام متكامل لاسترجاع الصور يعتمد 
على كل من النص واللون. وأثبتت التجارب على الاسترجاع باللون بمفرده. والنص 
بمفرده. والنص واللون Ua‏ أن تكامل النص واللون قد حقق أعلى درجة تحقيق 
بالقياس على ال ؟ وحدات الأولى يرمز لها بالرمز )5( والقياس على ال VA‏ 


4: ين‎ Gs gta cale, : الأولن‎ aas, 


Lu, Guojun and Williams, Ben. An Integrated WWW Image Retrieval System, the (1) 
author, 1999, visited at 6/10/2002, http://www.onlinemag.net/OL2000/net9.html 
ibid. (Y) 
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|| ® Text Only 
هأ‎ Colour Only 
U Text and Colour 


First 9 Results First 18 Results 
Number of Results 


الشكل رقم )1-1( 
يوضح نتائج التحقيق للون بمفرده والنص بمفرده واللون والنص معا 


ولقد لاحظ الباحث من دراسة Lu‏ و williams‏ تأكيدهما على الاستعانة 
بالمعاني والموضوعات الداخلية للصورة في استرجاعهاء في الوقت الذي تركزت فيه 
أفكار الكتابات الأخرى مثل K.W. Tobin, T.P. Karnowski‏ على الاستعانة بالشكل واللون 
وتية الصورة فى اء تظم استرجاع الصور C‏ 

واعتمادًا على هذا الهدف. فإن ما يلي يدور حول المعالجة الفنية المثلى 
للصور من خلال النص المصاحب لهاء متخذة من بيانات ملفات اللغة المعيارية 
HTML‏ أساسًا لتكوين وحدات معالجة الصور. ولأن هذا النوع من الملفات تختلف فيه 
أهمية الكلمات بحسب أماكن تواجدها داخل الملف» فقد اهتمت الدراسة بكيفية 
صياغة وصف الصور في كلمات محددة والأماكن التي تأخذها داخل ملف الصورة 
من نوع HTML‏ وعلى ذلك فإنه يؤخذ في الاعتبار مكان الكلمات المفتاحية الذي 
يعبر عن وزنها في استرجاع الصورة. وفيما يلي يتم تحديد أنواع المصطلحات 
ووزنها باعتبارهما المتحكمين في استرجاع صورة دون أخرى داخل ملف اللغة 
المعيارية. 


Karnowski, T.P. image retieval, Image Science and Machine Vision, 2002, visited at (1) 
12/5/2004, http://www-ismv.ic.ornl.gov/projects/video.htm 
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سادا 


فاا 


: مجموعة كلمات الرموز المعيارية Metadata‏ وهى الكلمات المرتبطة بتعريف 


صفحات الويب من لدن مصمميهاء Y) (39 sab,‏ ,^( في تأثيرها على 
استرجاع الصور. 


: مجموعة كلمات العنوان title‏ وهى الكلمة أو الكلمات القليلة المعبرة عن 


موضوع الصورة. وتأخذ وزن ( )٠,۲‏ في تأثيرها على استرجاع الصور. 


: مجموعة كلمات وهي الكلمات الأساسية الأولى المصاحبة للصورة إن 


وجدت Heading‏ وتأخذ وذن (Y)‏ في تأثيرها على استرجاع الصور. 


: مجموعة كلمات SameParagraph‏ وهى مجموعة الكلمات التى تم جمعها 


خصيصًا للتعبير عن موضوع هذه الصورة بذاتهاء وتأخذ وزن C Y)‏ في 
تأثيرها على استرجاع الصور. 


: مجموعة كلمات مسار ملف الصورة وهي أكثر الكلمات تعبيرًا عن المحتوى 


والموضوع كالسيارة والمواصلات والعميد. ويأخد وزن )42+( تأثيره. إلا 
أن هذا قد لا يناسب اللفة العربية باعتبار أن المسار يكتب باللغة 
الإنجليزية. ولكن في حالة ارتباط محرك البحث بقاموس يقوم بالترجمة 
الآلية إلى العربية فإنه يمكن الاستفادة من هذا المعيار. 


: مجموعة كلمات النص المتردد Alternate text‏ وتعرف هذه الكلمات بأنها 


كلمات توضع في cole‏ خاص لها يسمى alt component‏ حيث تعطي أقرب 
وصف لمحتوى الصورة. وتأخذ وزن )١0,4(‏ في تأثيرها على استرجاع 
الصور. 


: مجموعة مصطلحات النص المعتمد Anchortext‏ وهو النص الذي يدعم 


من فيل المصمم عند إنشاء الملف يوضع داخل محارف «<a> and </a>‏ 
لكي تأخذ كلماته درجة أكبر في التأثير عن غيرها من كلمات ملف 
الصررة. ويأخذ (*,t)‏ في تأثيره على استرجاع الصور. 


: مجموعة المصطلحات الأخرى التي تدخل في تركيب ملفات الصور في 


sab, Tur‏ وزن (Y)‏ في تأثيرها على استرجاع الصور. 
وعلى النحو السابق فيرى الباحث أن مجموعات الكلمات لا يحب أن 


تستخدم فقط في استرجاع الصور بالكلمات. وإنما أيضا الوزن النسبي لهذه الأنواع 


=N ب‎ 


من الكلمات حسب أماكنها الذي يؤثر في ترتيب النتائج بالإضافة إلى إصباغ النتائج 
بدرجة أعلى من التحقيق. هذا بالإضافة إلى أن الدراسة قد انصبت على مناقشة 
المصطلحات والأماكن داخل ملف الصورةء ولم تتحدث عن مستويات التكشيف. ولا 
المصطلحات المستخدمة أو العبارات الواصفة. ومن ثم فإن أهمية وزن مصطلحات 
ملف الصورة يمكن أن تتعدى مرحلة البحث إلى التأثير في مرحلة الاقتناء والإضافة 
داخل محركات البحث. فإذا ما تم تدعيم برنامج الزاحف أو المنكبوت لالتقاط 
ملفات الصور حسب مجموعة كلمات محددة. مثل مجموعة كلمات العنوان. فإن 
ذلك يمكن أن يكون له أثر كبير في أهمية المجموعات التي سيقتنيها محرك البحث 
داخل قاعدة بياناته. 

أما الأمر الآخر والذي يمكن استخلاصه من الدراسة السابقة. أنه من 
الممكن أن تستخدم العناصر السابقة في مرحلة أخرى خلاف مرحلة البحث 
والاسترجاع ؛ حيث يمكن الاستفادة منها في إنتاج ملفات الصور بحسب مواصفات 
محددة وتوزيع ثابت للكلمات المكونة للنص المصاحب للصورة. مما يمكن أن يؤدي 
بدوره إلى إدخال خصائص التكشيف الآلي لملفات الصور مع التأكد من جودة هذا 
التكشيف في اختيار كلماته المفتاحية. 

كما يمكن أن تستخدم العناصر الأخرى فيما يسمى البحث في النتائج أو 
استخدام المرشحات لتنقية نتائج البحث. فمثلا يمكن استخدام البحث في 
مجموعات الكلمات AGIS‏ بحث معتمدة في حالة البحث في نتائج البحث. كما يمكن 
استخدام البحث في المسار كآلية بحث في المرشحات. 

وتنقسم نظم استرجاع الصور المعتمدة على تحليل المحتوى في شكل كلمات 
وهو النص المصاحب من حيث بحث ملفات الصورء إلى نوعين أساسين هما ؛ 
البحث باستخدام التقسيم الموضوعي.ء والبحث باستخدام الكلمات المفتاحية» وهما 
على النحو التالي:- 


V/Y/\/¥‏ البحث بالتقسيم الموضوعي 


يأخذ البحث بالتقسيم الموضوعي أكثر من مسمى» حيث يطلق عليه أيضًا 
اسم التصفح. كما أن تطبيق هذا البحث يختلف من مجموعة إلى أخرى. Leina‏ 
تقوم بعض مكتبات الصور بالاعتماد على أحد أنظمة التكشيف أو التصنيف في عمل 
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تقسيم موضوعي من الأقسام العامة إلى الأقسام ASY‏ تخصصيّاء تقوم بعض 
المكتبات الأخرى بعمل أنظمة خاصة بها. والعمل في مجال تنظيم الصور يسعى 
دائما إلى هدف التلافي مع مستخدمي فواعد بيانات الصور في تصور محتوى 
الصورة الذي يعطي إمكانية التنظيم. وفي الوقت نفسه يعطي الباحث ما يريد من 
معلومات مرئية محددة. ويعتمد أسلوب التصفح على شكلين أساسين من عرض 
محتويات مكتبات الصور؛ أولهما : عرض كل مجموعات الصور التي توجد داخل 
قاعدة البيانات. مع تقسيم هذه المجموعات في أقسام عامة تحوي مجموعات أكثر 
تخصصًاء وتكون هنا الصور في شكل لقطات صغيرة. على أن يصاحب هذه 
اللقطات بعض الحقول النصية التي توضح ماهية هذه الصورة وموضوعها ليتمكن 
الباحث من الحكم على صلة هذه الصورة بموضوع بحثه. ويتناسب هذا الأسلوب في 
التصفح daas‏ مع فواعد البيانات ots‏ الحجم الصغير من الصور؛ لان قواعد 
بيانات الصور كبيرة العدد لن يجد المستفيد الوقت الكافى للتعرف إلى كل ما فيها 
وتحديد ما يناسب احتياجاته الموضوعية. Lal‏ الشكل الثاني فهو تكشيف كل 
مجموعات الصور داخل فاعدة البيانات ثم وضع المصطلحات في الترتيب المنطقي 
لهاء على أن تكون في ترتيب من الأعم إلى الخاص إلى الأكثر تخصصيًاء وربط كل 
مجموعة من الصور بالمصطلح الذي يعبر عن موضوع هذه الصور باستخدام تقنية 
الربط الفائق. وهذا من الممكن ان يكون ملائما لطبيعة selga‏ بيانات الصور على 
الويب ذات الأعداد المليونية. 


وقد فطنت كل من C. Olivia Frost‏ و Anna Noakes‏ إلى أهمية أسلوب التصفح 
في استرجاع الصور. وتقدم دراستهما نظامًا يقوم على استرجاع الصور باستخدام 
التصفح من خلال الاعتماد على نظام التكشيف Artand Architecture Thesaurus‏ يعرف 
اختصارًا (AAT)‏ ويتم تقسيم المصطلحات إلى فوائم موضوعية Categories‏ تعبر عن 
مضنمون الصور. ''' وهذه الدراسة هي عرض لتجربة قامت بها مدرسة المعلومات 
بجامعة University of Michigan‏ لإنشاء نظام لاسترجاع الصور المبني على النص 
واطلق على هذا النظام أسم Art Image Browser‏ 51. واستكملت هذه الدراسة على 


Frost, C. Olivia and Noakes, Anna. Browsing Images Using Broad Classification (*) 
Categories, the University of Michigan, [2000?], visited 1/6/2002, ited at: 
http://www.dlib.org/dlib/november84/wang/11wang.html 
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أسئلة بحثية أهمها هل يمكن أن يوفر أسلوب التصفح المبني على نظام تصنيف 
المصطلحات الموضوعية وسيلة فعالة لاسترجاع الصور؟ وكيف يمكن للمستفيدين أن 
يحددوا موضع صورة واحدة أو مجموعة من الصور داخل هذا النظام 5 وما الفروق 
في الأعداد بين أسلوبي البحث الحر والتصفح؟ واعتمد هذا النظام على واجهة 
تحوي خياري الاسترجاع bel‏ بالبحث الحر أو بالتصفح., وتم عمل مداخل اساسية 
للتصفح من خلالها Gay‏ ما يختار الباحث منها وهي مدخل artist =author (lial!‏ 
ونوع الوسيطء والموضوع؛ والتاريخ. والوسط المرئي والعنوان. وعن طريق كل مدخل 
من هذه المداخل يمكن للباحث ان يتصفح كل مجموعات الصور في فاعدة بيانات 
النظام. 


وذكرت هذه التجربة أن أسلوب الاسترجاع بالتصفح يجعل احتمالات الخطأ 
في تحديد الصور المطلوبة والمسترجعة في أدنى حد لهاء هذا لأن وصف الصورة 
في الكلمات والمصطلحات المنفردة أو العبارات التي يتم بحثها بالكلمات المفتاحية 
تتسم بالضعف في التعبير عن موضوع الصورة. فضلا عن أن تلك النظم ترتكز 
على أساس الاستدعاء العالي مقابل التحقيق المنخفض. كما أن المستخدم الذي 
يبحث عن صورة بعينها يمكنه اختيار وتحديد مجموعة من الصور التي تلائم 
موضوعه خلال عملية تصفح كل مجموعة الصور. 


وقد ذكرت الدراسة النتائج الأخيرة التي أعطت مؤشرًا على أهمية أسلوب 
التصفح في تحقيق درجة أعلى من التحقيق لاسترجاع الصور. وأهم النتائج أنه 
بصفة عامة قد أنهى كل المستخدمين المتمرسين عمليات البحث في وقت قصير 
مع الوصول إلى أعلى درجة تحقيق.. بينما زاد وقت البحث قليلا لمن هم أقل 
مهارة في عمليات البحث. ومن بين TV‏ من مستخدمي النظام اكد YY‏ أن النظام 
قد حقق 2٠١‏ من عدد مرات البحث وإخراج النتائج.. بينما أكد اثنان نقط من 
مستخدمي النظام أن الإصابة في البحث كانت بمقدار AYO‏ من مرات البحث؛ ولم 
يذكر أي من مستخدمي النظام فشل النظام في الاستدعاء المطلوب. وأظهرت 
النتائج أهمية وجود أكثر من أسلوب لاسترجاع الصور سواء التصفح d‏ البحث 
الحر. حيث يكمل كل من الأسلوبين الآخر. كما ذكر مستخدمو النظام أيض الأهمية 
الكبرى للوصف المصاحب للصورء بالإضافة إلى أهمية الترتيب المنطقي للقوائم 
الموضوعية التي يسرت من عمليات البحث داخل فاعدة البيانات. واختلف مستخدمو 
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النظام من المتمرسين وغير المتمرسين في البحث ؛ في إجابتهم على سؤال أي 
المعلومات يريد المستفيد عرضها مع الصورة. حيث أكد ذوو الخبرة أنه يمكن 
عرض معلومات عن سيرة الفنان صاحب اللوحة أو الصورة؛ ويمكن أيضا عرض 
معلومات نقدية خاصة بالصورة ككيان فني. خاصة إذا ما تم استخدام هذه الصور 
في النواحي التعليمية. أما النوع الآخر من المستخدمين فقد أكدوا الحاجة إلى 
معلومات عن الفنان وروابط تصل بالمجموعات الأخرى من أعماله وأيضا روابط 
إلى صور أخرى تشبه خصائص الصورة المنتقاة. 


وخرجت الدراسة بنتيجة مؤداها أن نظام الاسترجاع يتأثر بشكل كبير 
بطبيعة المستخدمين. حيث لم يكن البحث في فوائم نوع الوسيط type‏ طبيعة 
الوسيط medium‏ ذا قابلية من جانب المستخدمين الأقل مهارة في البحث . 


ولقد ذكرت جمعية الخدمة الفنية الاستشارية للصور أن حقول البيانات 
المرتبطة الواصفة لملفات الصور إنما تتكون أساسا من شقين ؛ الأول : نوع بيانات 
الوصف أو بنيتها الأساسية وهي كحقول بيانات مارك أو معيار دبلن كور. الثاني : 
الكلمات التي ستوضع داخل الحقول الواصفة لملف الصورة مثل ماهية كلمات وصف 
المحتوى وطبيعة قائمة رؤوس الموضوعات أو المكنز المستخدم. وعلى ذلك تبرز 
الأهمية الكبيرة في اختيار أداة ضبط الكلمات الواصفة لمحتوى أوعية الصور 
الرقمية إذا ما تم الاتفاق على التعامل مع محتوى الصورة باللفة المقيدة أو 
المضبوطة. وقد قدمت أيضا مجموعة من الاعتبارات الواجب مراعاتها عند اختيار 
قائمة الضبط في نظام استرجاع الصور الرقمية. وهي C) ca DUIS‏ 
المستفيدون : تحديد مدى ملاءمة فائمة الموضوعات المختارة للمستفيدين 
في إعطاء المعنى الكامل للتعبير عن المحتوى. 
طبيعة المجموعات : حيث أن المجموعات قليلة العدد لا تحتاج إلى أداة 


تحتوي على تفاصيل كثيرة: والعكس صحيح من ذلك. 


Controlling your language - links to metadata vocabularies. TASI Technical Advisory (1) 
Service for Images, 2003, visited at 12/12/2003, visited at 
http://www.tasi.ac.uk/resources/vocabs.html 
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مهارة اختصاصيي المعلومات: وهي مدى ملاءمة طبيعة أداة ضبط 

المصطلحات لمهارة العاملين داخل نظام الاسترجاع» فلا يجب الاعتماد على 

cl gal‏ المعقدة التي لا تناسب مهارة العاملين في النظام. 

مجتمعالخدمة: حيث إنه من المناسب الاعتماد على أداة ضبط 

لمصطلحات تلائم المجموعات الأكثر استخدامًا من جانب العاملين. 

إضافة إلى ذلك فهناك مجموعة من العوامل المساعدة التي يجب أن تؤخذ 
في الاعتبار عند الأخذ بأسلوب التصفح مثل سرعة تحميل الصور على شاشة 
عرض النظام ؛ حيث يتوقف عل ذلك الوقت الذي يمكن فيه للمستفيد تصفح كامل 
قاعدة البيانات. سواء طال هذا الوقت al‏ قصر. نتيجة لأداء نظام الاسترجاع. 
وكذلك حجم شاشة العرض وعدد الوحدات المسترجعة في كل شاشة yore‏ بجانب 
ذلك أيضا حجم كل وحدة من الصور بحيث تكون الوحدة على أصغر حد لها بما لا 
يتعارض مع إمكانية إظهار تفاصيلها أمام الباحث. ويتعلق بهذا الأمر الجودة التي 
تم بها إدخال الصورة إلى النظام. ومن ذلك أيضا تصميم واجهة الاستخدام 
للنظام ومداخل التصفح امام Las ium LE‏ يوفر للباحث مداخل غير معقدة للبحث 
ونظام تصنيف المداخل بما يسمح للباحث أن يتحرك من الأعم إلى الأخص 
PW‏ 
V/i/Y/N/Y‏ علاقه التصفح باللقة المضبوطة 
يعتمد التكشيف على اختيار الكلمات المفتاحية التي تصف محتوى وسيط 

المعلومات. حيث يعد إحدى عمليات التحليل الموضوعي التي تقف عند مستوى 
المحتوى الموضوعي والتعبير dic‏ بالكلمات أو المصطلحات المفتاحية. وهو خلاف 
ما يحدث في عمليات التحليل الأخرى مثل التصنيف في التعبير عن الموضوع 
بواسطة رموز من حروف أو أرقام؛ وعملية الاستخلاص التي تتعدى مستوى الكلمات 
إلى مستوى Jor‏ واصفة مكونة شكل المستخلص النهائي. وبرز مصطلح لغة 
التكشيف من خلال طبيعة المصطلحات المستخدمة للتعبير عن المحتوى 
الموضوعي ؛ فإذا ما تم الاعتماد على قائمة من المصطلحات المعدة والمختارة 
مسبقاء أصبحت اللغة مقيدة أو محكومة أو مضبوطة. أما إذا تم الاعتماد على 
طبيعة الكلمات التي وردت في النص أو العنوان وفمًا لما اختاره المؤلف. أصبحت 
all‏ طبيعية. ويتم الاعتماد فقط في هذه الحالة على طبيعة آليات البحث داخل 
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قاعدة البيانات وليس على المطابقة بين قائمة المصطلحات والمداخل التي وضعت 
أسفلها مصادر المعلومات داخل قاعدة البيانات. 


ويمثل التصفح برؤوس الموضوعات أو المصطلحات Jal‏ الويب نموذ جا من 
نماذج الاعتماد على اللفة المقيدة في التكشيف وتحليل محتوى مصادر الويب» ذلك 
لما يرتبط به من تقيد مستخدم نظام الاسترجاع بقائمة مصطلحات هرمية 
التنظيم يتم ربطها بمجموعة مصادر المعلومات التي تتوافق مع دلالة كل من 
المصطلحات. وهناك من أدوات بحث الويب مثل Yahoo‏ ما يعتمد على قائمة من 
المصطلحات الخاصة بالموقع تندرج أسفل منها صفحات الويب التي تلبي الحاجة 
الموضوعية الخاصة بكل من المصطلحات. ويمكن في هذه الحالة الاعتماد على أي 
من المكانز الخاصة بالتكشيف في مجال محدد أو مجالات متعددة بصياغة شكل 
من أشكال التصفح الداعم للتحكم في مجموعة ثابتة من المصطلحات تتكون على 
La jl‏ فوائم رئيسة ثم فرعية تدرج fiul‏ منها محتويات فاعدة البيانات ككل. وقد 
اعتمدت بعض أدوات البحث على نظم تصنيف معدة linua‏ مثل تصنيف ديوي 
والتصنيف العشري العالمي» أو أن تعتمد بعض المواقع الأخرى على صياغة أشكال 
من نظم التصنيف تلائم المحتويات الخاصة بها من مصادر الويب. وقد ذكر Gila‏ 
عطية بعضًا من جهود تصنيف المعلومات على الويب في سرد مجموعة من نظم 
التصنيف المعدة مسبقًا أو ذاتية البناء. بالإضافة التي تقسيم تلك النظم إلى 
أنماط dale‏ متعددة fie‏ نظم التصنيف المكتبية كنظام مكتبة الكونجرسء ونظم 
التصنيف القومية كالتصنيف الأساس في هولندا والتصنيف القومي السويدي 
للمكتبات dale!‏ ونظم التصنيف الموضوعية كالتصنيف الخاص بمجال الحاسب 
الآلي والتصنيف الموضوعي للرياضيات» ونظم التصنيف المولدة في البيئة الرقمية 
كتصنيف بوابة Edinburgh Engineering Virtual Library‏ وتصنيف بوابة Social Science‏ 
.Information Gateway‏ وقد أكد الكاتب وجود 71 Gruas‏ على الأقل تخدم تنظيم 
المعلومات على الويب ثلاثة منها عالمية. واثنان قوميانء وأربعة موضوعية» وسبعة 
خاصة. مما يعني البحث الدؤوب حول نظام تصنيف يوفر الدرجة الأفضل من 
التحقيق داخل النتائج المسترجعة. ومن بين ما أكدت عليه هذه الدراسة أيضًا أن 
أغلب المواقع قد لجأت إلى استخدام نظم التصنيف العالمية خلاف النظم القومية. 
وذلك لما لها من ثبات وتجربة سابقة في الاستخدام لاسترجاع المعلومات. كما جاء 
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أيضًا من بين النتائج أن أغلب المواقع قد لجأ إلى استخدام المكانز بدلا من قوائم 
رؤوس الموضوعات لما لها من سمات مهمة fis‏ الاعتماد على المصلطلطلحات المفردة 
إضافة إلى التخصص الموضوعي في مجالات محددة يفطيها مجال موقع الويب 
يل v)‏ 

ويمثل العرض السابق المحاولات التي تسعى إليها أدوات بحث الويب 
لتحسين الاسترجاع المعتمد على استخدام اللفات المقيدة من نظم التصنيف 
والتكشيف العالمية أو ذاتية البناء. وتستخدم فقط أدلة بحث الويب قوائم 
المصطلحات هرمية البناء لاسترجاع المعلومات باسلوب التصفح الذي تفتقد إليه 
محركات البحث المعتمدة على أسلوب البحث بالكلمات الحرة. وعلى ذلك فإن كلا 
من فوائم مصطلحات التصفح وأدلة البحث وجهان لعملة واحدة هي لغات التكشيف 
المقيدة أو المضبوطة؛ إلا أن محركات البحث الآن وعلى رأسها Google‏ قد عملت 
على تدعيم عمليات البحث الحر لديها بمجوعة من قوائم المصطلحات هرمية 
البناء ذاتية التكوين للوصول إلى مستوى اعلى من التحقيق في نتانج بحث قاعدة 
البيانات لديها. 
۳ مشكلات التصفح في استرجاع الصور الرقمية 

تقف مشكلات التكشيف بقوائم التصفح عند مستوى اختيار اللفظ أو 
المصطلح الملائم للوضع في قائمة الموقع والذي سوف تندرج أسفل منه مجموعة 
مصادر المعلومات الرقمية. إن السمة الأساسية في بناء قوائم رؤوس الموضوعات 
هي اعتماد مجموعة من المصطلحات دون الأخرى التي تقع معها في نطاق الترادف 
للتعبير عن الموضوعات ومن ثم تنظيم مصادر المعلومات أسفل هذء المصطلحات 
للبحث بها من جانب مستخدم الويب» ويعتمد اختيار رأس الموضوع و الواصفة في 
المكانز على اسس محددة fie‏ مدى شيوع هذا المصطلح بين لمستخدمين؛ 
واختيار رأس الموضوع المخصص. والصيغة العامة للموضوع. 

وعلى ذلك فإنه يمكن القول إن تخصيص قائمة رؤوس موصوعات بعينها 
داخل نظام استرجاع الصور لبناء اسلوب التصفح يعتمد في البدلة على دراسة 


(la (1)‏ محيى الدين عطية. جهود تصنيف المعرفة فى البيئة الإلكترونية: دراسة استكنافية -.الأكاديمية 
للمكتبات والوثائق والنظم المعلوماتية. ع١ Lc (YE)‏ ص٥-۷۷.‏ 
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مجموعات الصور داخل قاعدة Lit!‏ كما يعتمد على دراسة محتوى الصور 
الرقمية وتعدد الموضوعات التي تحتويهاء فضلا عن تعدد المصطلحات التي تندرج 
أسفل منها الصورة الرقمية لما تتميز به من وصف موضوعي ذات أبعاد متباينة. 
إن اختيار المصطلح الكشفي من جانب المكشف يعتمد على المعنى الملائم 
لموضوع الصورة ومن ثم يمكن هنا تلافي مشكلات معنى المصطلحات الكشفية 
للموضوع؛ إلا أن اختيار اللفظ الملائم هو ما يؤثر فعليًا على مستويات التحقيق 
والاستدعاء في استرجاع مصادر المعلومات الرقمية بصفة عامة والصور الرقمية 
بصفة خاصة. ويكمن هذا خاصة عند العمل مع اللفة العربية التي تبرز مشكلاتها 
في المعنى واللفظ عند العمل باللغة الطبيعية. وهو ما يسمى البحث الحر بالكلمات 
المفتاحية المعتمد على التكشيف الذاتي لمحركات بحث الويب. 


77/1 البحث الحر بالكلمات المفتاحية 
ينقسم البحث الحر بالكلمات المفتاحية إما بالواصفات المنفردة أو 
بالواصفات المتعددة ولكل منها خصائصها. وفيما يلى وصف كل منها بالتفصيل:- 


۳ الوصف الموضوعي بالواصفات المنفردة 

يعتمد وصف محتوى الصور في هذه الحالة على مجموعة من المكائز 
ورؤوس الموضوعات. وتعتمد مكتبات الصور في وصفها الموضوعي لمجموعاتها على 
مكانز متخصصة للمواد المصورة أو قوائم رؤوس الموضوعات العامة. والأمثلة هنا 
كثيرة لهذه الأدوات fie‏ مكنز الفنون والعمارة Art and Architecture Thesaurus AAT‏ 
ويحتوي هذا المكنز على all ٠٠١‏ مصطلح تصف مختلف وسائط المعلومات 
الثابتة. ومكنز موضوعات مكتبة الكونجرس للمواد المرسومة Library of Congress‏ 
Thesaurus for Graphic Materials‏ ويعرف اختصازرًا (LCTGM)‏ وأيضا مكنز الأسماء 
الجغرافية Thesaurus of Geographic Names‏ ويعرف اختصازرًا (TGN)‏ وبالنظر إلى 
المسميات السابقة لأدوات تكشيف الصور والمواد AS pall‏ فإنها جميعًا تعطي 
مفهومًا مختلفًا عن المفهوم التقليدي للمكنز. حيث تعكس هذه الأدوات جانب 
التخصص في المكنز بشكل آخر. فالتخصص لهذه المكانز ليس من حيث الموضوع 
وإنما من tum‏ شكل المادة الموصوفة. 

ولقد تناول تقرير المعهد العلمي للمعلومات المصورة Institute for Image Data research‏ 
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تكشيف الصور بالكلمات المفتاحية. وأظهر المعهد في هذا التقرير أن التكشيف 
بالكلمات المفتاحية لا يناسب طبيعة المستفيدين في التعرف إلى احتياجاتهم من 
الصورء كما أنه لا يناسب Jalas‏ محتوى هذا النوع من الأوعية الذي يتضمن بداخله 
الكثير من الموضوعات التي يمكن أن تفيد أكثر من صنف من الباحثين في مجالات 
مختلفة. وقد ذكر التقرير أن هذا الأمر يرجع إلى عاملين أولهما: أن الوقت 
المستغرق في عملية تكشيف وتحليل وحدة من الصور تستغرق ما بين V‏ دفائق 
للصور الفوتوغرافية إلى t+‏ دقيقة لإحدى الشفافيات وذلك اعتمادًا على أداة AAT‏ 
ثانيهما: أنه بمراجعة الكلمات المفتاحية التي وضعها المكشفون للتعبير عن المحتوى 
كانت تختلف في مفردات كثيرة عن تلك التي وضعها المستفيدون لوصف نفس 
Reda Ren‏ سن ا 


والجدير بالذكر أن ذكر جوانب السلب السابقة لا تنقص من أهمية 
التكشيف للصور. وإنما العمل هنا لم يكن متكامل الجوانب ؛ فنظام الاسترجاع له 
جوانب عدة ليس فقط الكلمات المفتاحية. فقد يساعد على تحقيق درجة أكبر من 
الدقة أن توضع قوائم استناد للمصطلحات تساعد الباحثين في التعبير الصحيح 
عن الموضوع» كما يمكن ربط الصور المتقاربة في المحتوى معًا من خلال الربط 
الفائق تساعد هذه الصور المرتبطة معًا في تحديد المجموعة التي يسعى إليها 
الباحث. ومن جانب آخرء فان النتائج التي توصل إليها هذا التقرير تؤكد على أن 
الصعوبة الأولى في عملية تحليل محتوى المواد المصورة تأتي في التعرف إلى كل 
الجوانب الموضوعية التي تغطيها الصور. كما أن النتائج الخاصة بتكشيف الكلمات 
المفتاحية تؤكد أيضًا مدى أهمية وصف المحتوى بالشكل السردي في شكل ملخص 
يحكي محتوى الصور. ذلك GY‏ هذا الشكل يمكن أن يكون أقرب تمثيلا إلى ذهن 
مستخدمي نظام استرجاع الصور. 


ويمكن القول إن هذا الأسلوب من أساليب الاسترجاع للصور وهو استخدام 
النص ليس على الدرجة الكاملة التي تحقق الدقة المطلوبة في استرجاع الصور. 
وهذا يرجع لأن كل موضوعات الصورة التي توجد بداخلها لا يتم تمثيلها بالشكل 
الذي يعكس كل محتويات الصورة أو يكون بالشكل الخاطئ في تعريف الموضوعات. 


Eakins, John P and Graham, Margaret رع‎ Optc. P25. O) 
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وتقوم الكلمات المفتاحية بالدور الرئيس في عرض كل الموضوعات. وتفسير هذه 
المشكلة يكمن في تقسيم التحليل الموضوعي للصورة إلى مستويات ثلاثة. ويكون 
وصف موضوعات الصورة على النحو التالي:- 


المستوى الأول : : يختص هذا المستوى بالعناصر التي a‏ تقع عليها Cras!‏ أول 
ما ترى الصورة ويستخدم المكشف المكنز أو أداة التكشيف في التعبير عن كل 
عنصر Los‏ يوافقه من واصفات في المكنز أو قائمة رؤوس الموضوعات. ويجب أن 
يكون مبدأ الإحاطة هو أساس العمل في تكشيف الصورة. وذلك لعاملين: الأول أنه 
في الوقت الذي على المكشف أن يصف كل موضوعات الصورة الرئيسةء فإن 
الكلمات المنفردة لا تعطي المكشف الإيجاز في التعبير. وهي ما يمكن أن نطلق 
عليها العناصر الحاكمة للمكشف. 


المستوى الثاني: يكون لإبراز العناصر الثانوية التي تعتمد عليها الصورة 
في استكمال كل أجزاء الم ولا تقل هذه العناصر ا عن العناصر الأولى ؛ 
ذلك لأن الاسترجاع بالكلمات المفتاحية دائما ما يعتمد على مصطلحين أو أكثر 
لتحديد موضوع البحث. وهنا يتم الحديث عن مختلف الأشياء الأخرى مهما بلغ 
صغر هذه العناصر. وهي ما يمكن أن نطلق عليها العناصر الذهنية. 


المستوى الثالث: يعبر هذا المستوى عن العناصر المعنوية التي تريد 
الصورة التعبير عنها وإيصالها إلى من يراها. يجانب العناصر الأخرى. ويعد هذا 
المستوى أصعب المستويات الثلاثة أداءٌ. ذلك لأن الاختلاف بين المستفيدين 
والمكشفين a‏ فى الصور يمع في هذا المستوى؛ لأن المعنى الموجود في الصورة سوف 
E a cat‏ آخره من Uu‏ كانه من Aen‏ ينكان assai capa a gl‏ 
مع تمام الوعي بنوع المستفيدين من نظام استرجاع الصور. وهي ما يمكن أن نطلق 
عليها العناصر الضمنية أو المعنوية. 

وتوضح الصورتان رقم )١(‏ ورقم (Y)‏ مثالين لبيان مستويات تكشيف 
الصور. واختار الباحث نوعين من أنواع الصور ؛ فتعبر الصورة رقم (Y)‏ عن 
الصور الفنية أو الطبيعية. بينما تعبر الصورة رقم (Y)‏ عن الصور الإعلامية. ويتم 
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مثال لتحليل الصورة بالكلمات المفتاحية 


صورة مكشفه رقم ١‏ 


الشكل رقم (Y-T)‏ يوضح نموذجي تكشيف الصور الرقمية اطبيعية 


الصورة الأولى النخيل الرمال 
المياه السحاب 
الشاطىٌ الشمس 
Ad‏ 
pal‏ 
الصورة الثانية يانج زيمين الزهور 
فلادیمیر بوتين ستارة 
الصين ale‏ الصين 
| روسيا منضدة 


إن تكامل هذه الواصفات Lae‏ على اختلاف مستويات التكسيف يؤدي إلى 
درجة عالية من الدقة في حال التعامل الجيد مع عناصر الصورة لكل. ومن جهة 
أخرى يمكن التحكم في كل من الإحاطة والتخصيص كمبادئ أسسية للتكشيف, 
بتكوين الواصفات التى تعبر عن ذلك. 


BD 


٠۳‏ الوصف الموضوعي بالعبارات 

يختلف الوصف الموضوعي بالعبارات عن الوصف بالكلمات المفتاحية, 
فالأخير يلزم المكشف بالمرور على المستويات الثلاثة في التكشيف. أما الوصف 
الموضوعي بالعبارات فإنه يمكن دمج المستويات المختلفة للتكشيف في العبارات. 
لتصبح مستوى واحدًا. ويتحدد مستوى التكشيف هنا بعدد العبارات الشارحة 
لمحتوى الصورة. سواء كان M nia‏ فيزداد فيه عدد العبارات أو مختصرًا فيقل 
على أثره عدد العبارات الواصفة. وتبمًا للمثال السابق يكون الوصف بالعبارات 
المنفصلة كما يلي:- 


الوصف بالعبارات 
الصورة آلأرتى مجموعة أشجار نخيل 
TTE‏ الاب 
الناس والشاطىٌ 
مياه البحر بجانب الرمال 
جمال رؤية البحر 
هدوء وقت الغروب 


حزن اختفاء الشمس 


الصورة apii‏ اجتماع الرئيس بوتين مع الرئيس زيمين 
علم الصين الشعبية 

العلاقة بين روسيا والصين 

التعاون بين الدول الكبرى 

نتاج السلام الدولي | 
العلاقات الدولية | 


لقد اعتمد الباحث في صياغة العبارات السابقة على إبراز جوانب المحتوى 
المادي أو الظاهرة أمام العين ثم الجوانب غير المرئية. ويختلف مستوى التكشيف 
من نوع إلى اخر في الصور الرقمية. إلى ile‏ اختلاف عدد الكلمات المفتاحية 
لوصف محتوى الصورة من نوع إلى آخر في كلام من الصور العلمية والإعلامية 
والطبيعية. 


L 5‏ 
على الجانب الآخر. فإن MS‏ من نسبة الاستدعاء والتحقيق تتاثران بعدد 
العيارات المستخدمة ضي وصف محتوى 39242 63 ذلك لأنه كلما زادت عبارات 


به 9513ب 


الوصف المستخدمة زادت نسبة الاستدعاء في هذا النظام. وعكس ذلك هو ما 
يحدث في نقص عبارات الوصف. ذلك لأن الزيادة في عبارات الوصف دائما ما 
تحمل معها الكثير من الكلمات المساعدة في الوصف التي فد لا تقترب لموضوع 
الصورة الرئيس؛ إلا أنها قد تدخل في إستراتيجيات بحث المستفيد داخل محرك 
البحث مما ينتج عنه استدعاء لمجموعات من الصور مختلفة في الموضوع الرئيس 
متفقة في الكلمات المساعدة لوصف الصورة. 
۴ الوصف الموضوعي بالجمل المترابطة 
يعتمد هذا النوع من وصف محتوى وموضوعات الصور على النص الشارح 
في شكل ملخص summary‏ على أن يكون هذا الملخص بنيانا كاملا لكل ما تعنيه 
الصورة. ويمكن أن يكون هذا الأسلوب هو الأكثر بلاغة في التعبير عن محتوى 
الصورةء كما أنه يمكن أن يكون الأجدى في استرجاع الصور اعتمادًا على النص. 
هذا إنما يرجع إلى عوامل كثيرة مثل طبيعة المستفيد التي فد تميل إلى شرح 
الموضوع أثناء عملية البحث» حتى أن الكثير من المستخدمين لمحركات البحث لا 
يستخدمون الكلمات المفتاحية. بل يستخدمون الجمل والعيارات. كذلك عناصر 
الصورة وهي أركان التكشيف التي تحوي فيما بينها الكثير من المعاني واجبة الذكر 
والتي يمكن أن يكون لها أكبر الأثر في استرجاع صور بعينها. وتمثيلا على الصور 
السابقة. فإن وصف المحتوى باستخدام الجمل يمكن أن يكون على الشكل التالي:- 
| | الوصف بالجمل المترابطة | 
الصورة الأولى مجموعة من أشجار النخيل تمتد إلى قلب السحاب وتلتقي أمواج مياه 
البحر مع الرمال مكونة الشاطئ. وعلى الجانب الآخر تختفي الشمس 
الصفراء وراء السحاب معلنة وقت الغروب بما له من هدوء وحزن وجمال 
الصورة الثانية | الرس الروسي قلا د يعر بون gash ly‏ السنيني باتع زيمين في | .| 
يجمعهماء تعكس الصورة العلاقة بين دولة روسيا الاتحادية ودولة الصين؛ 
وتعبر جوانب الزهور والعلم الصيني عن الصداقة والتعاون وجوانب 
المشاورة بين البلدينء والصورة من نتاج السلام والتفاهم الدولي 
إن ما سبق يمثل المستوى الثالث من مستويات التحليل الموضوعي للصور, 
يذكر البعد المعنوي للصورة. حيث اعتمد الباحث على استخدام الكلمات المفتاحية 
في المستوى الأول والعبارات المفتاحية في المستوى الثاني. 
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لقد أصبحت الفهرسة الوصفية والتحليل الموضوعي للصور هما السبيل 
الوحيد أمام قواعد بيانات الصور ومحركات البحث لتفادي مشكلات جمة في 
استرجاع الصور. فيذكر V Greg Notess‏ في حديثه عن بحث ملفات الصور على 
الويب. إن بحث واسترجاع ملفات gjall‏ خاصة عند البحث die‏ من جانب 
محركات البحثء. دائما ما كان يعتمد على النص المصاحب للصورة. وهذا النص 
يتمثل في الكلمات التي تكون اسم ملف الصورة وامتداده أو أن تكون الكلمات 

المعدودة المصاحبة للصورة أو تكون تلك التي تكون الرموز المعيارية Meta Tags‏ 

ولم تكن هذه GLAS!‏ المحدودة التي لا تعبر عن كل موضوعات الصورة مناسبة 

لاسترجاع أمثل لمادة الصور. ومن ثم كان الحل في الرجوع إلى قواعد الفهرسة 
الوصفية. واستخدام حقول الوصف الملائمة للصورة Jie‏ منتج الصورة والتاريخ 

واللون واسم الملف... الخ. مع إدخال الوصف الموضوعي المساعد في الاسترجاع. 

ولقد كانت حقول الوصوف الببليوجرافي للصور والتحليل الموضوعي لهاء هو ما 

أوصى به مصممو قواعد البيانات وعلوم الحاسب حيث أشار JoeFarace‏ ان حقول 
الوصف للصور والكلمات الكشفية المصاحبة لها هما اهم جوانب تصميم فواعد 
برامج قواعد بيانات الصورة الجيدة؛ التي يمكن ان تخدم الباحثين Les‏ ينتظرونه 
من نظم استرجاع الصور. والجوانب الواجب مراعاتها في تصميم قواعد بيانات 

الصور كما يلي :- 

> توفير برامج تستطيع قراءة كل أنواع الملفات التي يمكن أن توجد عليها 
الصورء والتي يبلغ عددها أكثر من ٠٠١‏ نوع القليل منها يستخدم للصور. 

v‏ توفير برنامج قاعدة البيانات بعرض ملفات الصور في لقطات sU‏ عرض 
النتائج, وإذا لم توجد هذه الخاصية. فان برامج مثل ThumbsPlus‏ يستطيع 
إنتاج هذه اللقطات من ملفات الصور. 

> توفير قاعدة بيانات جيدة تتيح للباحثين البحث بالكلمات المفتاحية المرافقة 
لملف الصور والتي تكون في أقل حالاتها عند استخدام كلمة أو كلمتين 
كواصفتين. 

Notess, Greg. Searching beyond text: issues with multimedia searching, information (1) 

today, 2000, visited 27/9/2002,: http://www.onlinemag.net/OL2000/net9.html 


Farace, Joe,. Take Control of Your Image Assets, computer user, visited at 21/9/ (v) 
2002, 2000, http://www.computeruser.com/articles/1907,2,3,1,0701,00.html 
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Y‏ توفير برنامج استرجاع صور الكفء يضم حقولًا واصفة تمثل تفاصيل الصور 
وسبيل استرجاعها. 

وقد عملت بعض الدراسات مثل دراسة irem Ze Wang‏ على استخدام 
تكشيف الصور الرقمية في تصنيف مجموعات الصور حسب الصفة الدلالية لكل 
منها؛ حيث يمكن استخدام مجموعة من رؤوس الموضوعات Alay‏ مجموعات رئيسة 
وفرعية في التعامل مع موضوعات الصور الرقمية. ومن ثم تشكيل مجموعات 
مختلفة من الصور تتفق كل منها داخليًا في الخصائص الدلالية مع اختلافها مع 
المجموعات الأخرى بما يمكن معه تيسير البحث والاسترجاع داخل قاعدة بيانات 
الاو وقد اختصت ad‏ الدراسة lepers‏ الكور Anal s RECA‏ تدكا 
للمنطقة أو الإقليم التابع له محتوى الصورة. ويوضح الشكل رقم (Y-Y)‏ المنهج 
المعتمد .في تنظيم واسترجاع .الصور. الرقمية المكشفة :- 


الشكل رقم م 
يوضح تصنيف الصور المبني على التكشيف الدلالي للمجموعات 


Wang, James Ze ...[etc]. Semantics-sensitive Retrieval for Digital Picture Libraries, (1) 
D-Lib Magazine, 1999, visited at 12/10/2003, cited 
http://www.dlib.org/dlib/november99/wang/11wang.html 
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Y/Y‏ معالجة اللغة العربية في نظام استرجاع الصور 

تتسم اللفة العربية بالكثير من السمات التي تنفرد بها عن غيرها من 
اللفات الأخرى. وعلى ذلك فإن ثمة تأثيرًا يمكن أن تحدثه اللغة داخل نظام 
الاسترجاع. ويجلو أثره أكثر على التحقيق والاستدعاء داخل نظام استرجاع الصور 
وكيفية تطويعها بشكل يحقق الكفاية لنظام استرجاع صور يعتمد في بنيته على اللغة 
العربية. والكيفية التي تكون عليها مصطلحات اللغة العربية داعمة مقياسي 
الاستدعاء والتحقيق؛ بما يرجوه المستفيد من نظام الاسترجاع. 
V/Y/Y‏ مشكلات البحث الحر باللغة العربية في البيئة الرقمية 

ينطوي مصطلح البحث الحر على استخدام البحث باللفة الطبيعية داخل 
النصوص الكاملة لمصادر المعلومات. وتلتمي دراسة aalll‏ الطبيعية ياسترجاع 
الصور عند دراسة الشكل الأخير من الوصف الموضوعي للصورة؛ وهو الوصف في 
شكل جمل سردية أو نص cold‏ فهو أقرب أشكال التحليل الموضوعي إلى 
مستخدمي الصور. وينتج عن العمل باللغة الطبيعية في بحث المصادر العربية 
الفئات التالية:- 
7۳ الاسترجاع اللفظي 

وهي مشكلات فد قام بحلها وجود برنامج التحليل الصرفي المضاف إلى 
معظم محركات بحث. ولكنها ستظل فائمة لولم يزود محرك البحث بيرنامج 
التحليل الصرفي. ومن ثم ينوه عنها الباحث هنا للتعريف بأنواع هذه المشكلات 
المرتبطة بخصائص اللغة dy pall‏ في حالة غياب المحلل الصرفي» وهي:- 
V/1/Y/Y/Y‏ صيفة الفعل 

وهي الصيغ المختلفة لمشتقات الفعل» فالبحث عن كلمة (gæl)‏ مع تحديد 
s Sa YI Y/V/N/Y/Y‏ ورسم الكلمات 

وهي المشكلات الناجمة عن الأشكال المختلفة لكتابة الكلمات خاصة في 
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حروف الهاء الختامية للكلمة مع التاء المربوطة: والياء اللازمة والألف المقصورة 
المرسومة بالياء, وهمزة القطع والوصل. وعلى ذلك فان بحثا لكلمة ) (>l‏ سوف 
يستدعي أيضًا الشكل الآخر للكلمة (أحمد). 


“7 الحروف والأدوات "قائمة التوقف" 


وهي التمييز بين الحروف والأدوات التي قد تعيق البحث مثل التمييز بين أل 
التعريف باعتبارها لواصق في الكلمة أو كأصل فكلمة مثل الله تعد فيها (أل) 
أصلية بينما كلمة مثل (GUSH)‏ لا تعد كذلك. وتعمل نظم الاسترجاع على حذف 
(أل) التعريف Bale‏ في مقدمة الكلمات ولكن ذلك يتطلب وجود قائمة كلمات 
التوقف التي تستبعد بعض الكلمات ومن ثم يكون من المناسب هنا وضع الكلمات 
التي تأتي فيها أل أصلية مثل (الذي و التي) وغيرها. 


۳ الاسترجاع بالمعنى 

وهي المشكلات التي تتعلق بالكلمات المفتاحية المستخدمة في وصف الصور 
الرقمية. ومن ثم فهي تتعدى الحدود اللفظية للمعنى الضمني. ومثل هذه المشكلات 
تعمل بعض محركات البحث على إيجاد حلول لها؛ إلا أنها غير Aabla‏ ومن أهم 
هذه المشكلات:- 


V/v/i/v/vY‏ المترادفات 
يعرف الترادف على أنه توالي الألفاظ المفردة الدالة على مسمى واحد 
باعتبار معنى واحد فيخرج عن هذا دلالة اللفظين على مسمى واحد. لا باعتبار 
واحد. بل باعتبار صفتين كالصارم والمهند أو باعتبار الصفة وصفة الصفة 
SED, es adis‏ ب tussi ous ataca sl‏ إلى ذلك أن islas:‏ 
لفوية تتعلق بالترادف وهي إنكار الترادف وإثباتهء فقد انقسم أهل اللغة إلى فريقين 
في هذا الشانء ويرى فريق الإنكار أن الشارع حكيم ولا توجد كلمة إلا ولها دلالة 
خاصة بهاء وتبعًا لذلك فلا ترادف في اللفة. أما فريق الإثبات يرى أن الترادف 
موجود باللفة وأن هناك كلمات عربية عدة مترادفة لم تأت عبثا وإنما هناك 


۲۰۰۲/۱۰/۲۲ عبد الرحمن بن حسن المحسنى .قضية الترادف: النظرية والتطبيق. تاريخ الاستشهاد‎ )١( 
http://www.adabiabha.com/biader/4.htm مسار‎ 
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مقاصد محددة لذلك. وأكد هؤلاء رأيهم بالأدلة العقلية والآيات القرآنية 
AUC‏ 

Li‏ من منظور نظم استرجاع المعلومات. فإن الترادف يسهم في ضياع 
جزء من التحقيق للمستفيد في استرجاع المعلومات. على عكس ما يكون الأمر عليه 
في مشكلة الاشتراك اللفظي حيث يعاني المستفيد من ارتفاع نسبة التشويش 
(الشوشرة) في النتائج المسترجعة. وعلى الرغم من أن المشكلة لدى الصوينع 
توقفت عند الكشافات اليدوية وتأثير الترادف على تشتت المداخل في الكشاف. إلا 
أن البيئة الرقمية لنظم الاسترجاع أعادت صياغة مشكلات اللغة العربية بمستوى 
بحث آخر خلاف ما يكون في البيئة التقليدية. وقد كانت الإحالات هي الحل الأمثل 
لمثل هذا النوع من مشكلات الاسترجاع اليدوي لمعلومات اللغة العربية C).‏ 

ويمكن تصوير الترادف في مثاله الشهير عن الكلمات الثلاثة المستخدمة 
لوسيلة الاتصال بالهاتف وهو (الهاتف - المسرة - التليفون) . إن بحثا في 
محركات البحث التقليدية من شانه ان يتسبب في ضياع جزء من وحدات المعلومات 
المنتمية للموضوع. 
7۳ الاشتراك اللفظي 

يقصد بالألفاظ المشتركة أو المشترك اللفظي مجموعة من المعاني 
والمفاهيم المختلفة التي تتوحد في مجموعة حروف واحدة مكونة كلمة ذات شكل 
واحد. بهذا فإن الباحث عند استخدامه لأحد الكلمات المتسمة بهذه السمة سوف 
يكون أمام فيض من المعلومات التي لا حاجة له بهاء ومن أمثلة ذلك أن يقوم باحث 
بالبحث عن صور عن (قطر) فيدخل كلمة (قطر) فتأتي أشكال رياضية تمثل 
(قطر) الدائرة. ولقد أثمر جهد نظم الاسترجاع بالاعتماد على تقنية التحليل 
المعجمي آلية البحث بالتشكيلء وعلى الباحث عند إدخال كلمة البحث ثم تحديد 
خيار البحث بالتشكيل لتعيين المعنى المطلوب اعتمادًا على شكل الكلمة؛ إلا أن 
فواعد البيانات التي تعنى بالصور لا تقوم بتشكيل الكلمات um aa!‏ ولم يظهر في 


)١(‏ المصدر السابق نفسه. 
(Y)‏ علي السليمان الصوينع .استرجاع المعلومات في اللغة العريية-. الرياض: مكتبة الملك فهد الوطنية. 
NAAL‏ ص“ ص VY-7AA‏ 
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الأفق حتى الآن التقنيات التي تسهم في إصلاح عمليات البحث في مصادر اللغة 
العربية. 


v/1/Y/Y‏ اللغة والثقافة 


تشكل الثقافة و البيئة التي يتم تكشيف الصور بها Wale‏ مهما في اختيار 
الكلمات المفتاحية عن محتوى هذه الصورة. ويمكن لصورة واحدة أن تستخدم 
لإيصال أكثر من معنى» وقد تكون هذه المعاني ليست daza‏ في حالة تباين وإنما في 
حالة تضاد في المعنى ؛ على سبيل المثال فإن صورة واحدة لطفل فلسطيني يحمل 
حجرًا يرمي به Laie‏ صهيونياء يمكن استخدامها لإيصال معنى (JU!‏ كما 
تستخدم على الجانب الآخر في الإعلام الغربي لإيصال معنى الإرهاب. وهو البعد 
الثالث في التعامل مع تحليل الصور. وقد ناقش Gila‏ محيى الدين الأبعاد المختلفة 
للصورة بمنافشة الطلاب لموضوع الصورة المكشفة في تعلم فراءة الصور 
وتعليمها.''' وعلى ذلك فإن معرفة البيئة التي تنتمي لها الصورة له أكبر التأثير في 
التعامل مع وصف وتحليل الصور الرقمية على الويب التي تمتزج داخلها صور عدة 
clu‏ متنوعة. 
۳ آليات التعامل مع اللغة العربية في البيئة الرقمية 

إن حلقة الكلمات المفتاحية والواصفات في نظم استرجاع المعلومات بصفة 
عامة ونظم استرجاع الصور بصفة خاصة: ترتبط بحلقة أخرى لا تنفك عنها أبدًا 
هي aail dale‏ والمقصود هنا لغة نظام الاسترجاع وملفات الصور. وليس لغة 


التكشيف. 


۳ أليات البحث بالكلمة الواحدة 

يعد التحليل الصرفي لب عمليات معالجة اللفة الطبيعية. حيث تقوم نظم 
الاسترجاع بتوفير هذه الخاصية لانتاج الكثير من إمكانات البحث المتولدة عن 
استخدام التحليل الصرفي لكلمات اللغة العربية. تبدأ هذه العملية بإضافة المعاجم 
اللغوية الآلية لنظام الاسترجاع. ولا ينسحب التحليل الصرفي على كل كلمات اللغة 


Gila (1)‏ محيى الدين عطية .تكشيف الصور بين العلم والتعلم: ورقة في ملف القضية الفلسطينية-. 
أسيوط: المؤتمر القومي الخامس لاختصاصيي المكتبات والمعلومات والأرشيف في مصر. ١١٠٠م.‏ 


INA 


العربية وإنما يستثنى من ذلك الحروف وأدوات التركيب... وغيرها من الكلمات 
التي لا تدل بمفردها على معنى معين. ويعد الإدريسي http://www.alidrisi.com/‏ وهو 
محرك بحث أنتجته شركة صخر للحاسبات من أهم نظم استرجاع المعلومات التي 
تعمل بتقنية التحليل الصرفيء مما أدى إلى بزوغ إمكانات بحث متقدمة لا ترى في 
غيره من محركات البحث العربية. لقد بات التحليل الصرفي الحل لمعالجة بحث 
اللغة العربية بعد تناوله من جانب الصوينع وغيره تعتبر محركات بحث الصور تربة 
خصبة تنمو بها تطبيقات التحليل الصرفي. حيث إن تحليل موضوعات الصور 
باستخدام اللفة الطبيعية يحقق الهدف المرجو في استرجاع الصور العامة. 


وتتمثل تقنيات البحث المتقدمة المتولدة عن التحليل الصرفي للغة العربية 
فيما يلي:- 


۳ اليحث بالتطابق 

يطلق على هذا النوع من البحث مسميات عدة منها البحث بالكلمة أو 
البحث بالمطابقة. وتعتمد هذه الطريقة على وضع كلمة محددة يبحث بها نظام 
الاسترجاع داخل محتوياته. على أن المضاهاة هنا اعتمادًا على نفس الشكل الذي 
أقره المستفيد لإجراء البحث؛ فإذا ما استخدم المستفيد مثلا كلمة (عربي) فإن 
النظام يعمل على استرجاع كل الوحدات التي تحتوي على كلمة عربي.. بينما لا 
يسترجع النظام وحدات الكلمات الأخرى مثل (عرب» عربةء عربية) . ويحتاج 
المستفيد إلى هذا النوع من البحث في حالة طلب معلومات عن موضوع له 
مخصص بحيث يهتم المستفيد بالتحقيق أكثر من الاستدعاء الذي ستكون نسبته 
في هذه الحالة قليلة جدًا. 
۳ البحث غير المطابق 'البحث باللواصق”" 

يختلف هذا الشكل من البحث عن الشكل السابق في توسيع نطاق البحث 
داخل النظام. والبحث غير المطابق للكلمة مؤداه أن يسترجع النظام مختلف 
الأشكال للكلمة الواحدة. مع استدعاء أشكال الكلمة مع كل اللواصق التي تسبقها 
أو تليها في وحدات نظام الاسترجاع. فمثلا إذا أراد الباحث البحث عن كلمة 
(عرب). فإنه سيحصل على (عرب» quie‏ عربية. عربيات) وكذلك يسترجع 
جميع الكلمات التي تحمل سوابق مثل (العربي» وللعربي» وبالعربي) ومثلها للكلمات 
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الأخرى "© وما dtt‏ لكل ac‏ اسفن من D a pasci‏ حضون 
على كل وحدات المعلومات حول موضوع محدد يتمثل في كلمة محددة. 
“7 البحث بجذر الكلمة "حل مشكلة الاشتقاق" 

يأتي هذا الشكل في المستوى الثالث من توسيع نطاق البحث. وهم أهم أمثلة 
استخدام التحليل الصرفي للفة العربيةء ويعني إجراء تحليل الكلمة إلى الحروف 
الأصلية بها واستخدامها نواة للبحث داخل نظام الاسترجاع. ومثالا على ذلك فإن 
باحثا عن معلومات تتعلق ب ( عرب) سوف تؤدي إلى استرجاع وحدان من داخل 

l "UN Mm 1 : TETTE 

النظام ġa‏ كلمات wpe)‏ عربي؛ عربیه؛ عروية.... إلخ) ٠.‏ :يودي هذا 
الشكل من البحث بطبيعة عمله إلى استدعاء عدد غير محدود من مصادر 
المعلومات. عملا على تجميع كل ما يتعلق بالجذر موضع البحث. ويترب على نوع 
البحث نوع المستفيدين فالمستخدم لهذا الشكل من البحث يلجأ إليه غد الحاجة 
إلى كل ما يتعلق بالموضوع سواء من قريب أو بعيد نظرًا لما يمكن استدعاؤه من 
معلومات. ولكن يعيبه أنه قد يأتي GLAS‏ ليس لها علاقة بالموضع مل (عراب. 
إعراب). 
cuo £/1/v/v/v‏ بالتشكيل لكلمات المشترك اللفظي 

يطلق على البحث بالتشكيل مسمى فك اللبس كما ورد في بعس مصادر 
الحديث عن أشكال البحث في اللغة العربية. ويخدم هذا الشكل المسفيدين في 
تفادي أحد أهم عوائق الاسترجاع في اللغة العربية وهو المشترك اللفظي للكلمات. 
مثل (ele ele (ale)‏ . وقد عانى المستفيدون من كثرة الاختلاط بين الأشكال 
المختلفة للكلمة الواحدة. وكان الحل البديل هو وضع كلمة أخرى بجنب الكلمة 
المختلطة للاسترشاد بمعنى الكلمة الأخرى. ويعطي هذا الشكل للمستيد أقصى 
درجات الدقة في الحصول على التحقيق المطلوب. وتتمثل طريقة استغدام شكل 
التحليل الصرفي للغة داخل النظام. 
)*( إرشادات البحث في الإدريسي. (Y: 0٠١/٠‏ مسار 

http://asb.kacst.edu.sa/IDRADMIN/Arabic/Help/ATips.htm 


(Y)‏ مساعد بن صالح الطيار .محركات البحث العربية وطرائق البحث فيهاء الجزيرة Y V‏ تاريخ 
الاستشهاد ۲۰۰۲/۱۰/۱٠۰‏ مسار http:/www.al-jazirah.com.sa/evillage/22112001/wr1.htm‏ 
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۴ البحث بالمقاطع (أجزاء الكلمة) 


يقوم هذا الشكل على إعطاء مجموعة من المعاملات أو الحروف التي 
يستخدمها الباحث في تشكيل إستراتيجية بحثه كما يريدء وتتركز هذه الحروف 
في علامات )8 *) على أن استخدام هذه العلامات يختلف بين نظام وآخر, 
ويوجد جانبان من استخدام هذه الآلية في البحث هما استخدام معاملات البحث 
بالمقاطع في منتصف الكلمات. أو استخدام المعاملات في نهاية الكلمات؛ Lal‏ 
الجانب الأول من الاستخدام وهو في منتصف الكلمات فيأتي إما لعدم pan‏ 44 
الياحث بالحروف الصحيحة المكونة لكلمات TOP WA‏ مثل البحث عن عرب 
تسترجع كلمات sol ye‏ وأما الجانب الثاني من استخدام معاملات اليبحث الحر 
فيأتي في نهاية الكلمة ويستخدم للتخلي عن البحث بكلمات متعددة تشترك في 
أصل واحد مختلف الامتدادات وتستخدم العلامة (*) للتعبير عن مجموعة من 
الحروف التي i a‏ نهاية الكلمه vos) m‏ «) فإنها تسترجع Aye quoe‏ 

O) 

الخ . 


w/1/Y/Y/Y‏ البحث يحساسية الحالة 


يعبر هذا الشكل عن المصطلح casesensitive‏ ويطلق عليه في بحث 
الإدريسي مراعاة حالة الأحرف. ويستخدم المستفيد شكل البحث في حالة إذا ما 
أدت الأشكال المختلفة لحروف الكلمة معاني مختلفة. يعمل البحث بحساسية 
الحروف أو شكل الحروف على البحث عن اتجاهات موضوعية مختلفة لموضوع 
واحد ولكلمة واحدة ؛ حيث تعمل شكل الكلمة على بيان جانب من الموضوع مثل 
كلمة pul‏ فإن استخدام البحث بدون حساسية الحروف يسترجع كلمات أخرى 
مثل إعلام . حيث يعامل حرف الألف كحرف واحد دون الأخذ في الاعتبار حالة 
الهمزة (uut)‏ وتستخدم هذه الآلية في محركات البحث متعددة الموضوعات, 
هذا إلى جانب اختيار شكل الحروف كواحدة من أدوات ضبط المصطلحات في 
عمليات التكشيف بما يصنع معه تحديدًا أكثر للمصطلحات الكشفية. ولم يتعامل أي 
من محركات البحث السابقة مع البحث بشكل الحروف. وهذا يرجع في رأي الباحث 


)*( إرشادات البحث في الإدريسي. مصدر سابق. ص n‏ 
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إلى أن مثل هذه الآلية تحتاج إلى مرحلة متقدمة من البحث من جانب 
المستفيدين.. الأمر الذي لا يتناسب مع الاستخدام العام للويب. 
۴ البحث بالمترادقات 

في هذا النوع من البحث يرتكز نظام الاسترجاع في إجراء البحث على 
المعجم الآلي. حيث تحديد المترادفات لكلمة tie!‏ واستخدامها في استدعاء 
مصادر المعلومات من وحدات النظام التي تحتوي على مرادفات كلمة البحث. 
فمثلا يؤدي البحث عن كلمة تجهيز إلى استرجاع جميع المستندات المفقهرسة؛ 
التي تحتوي على كلمة ( تجهيز) أو إحدى مترادفاتها مثل: إعداد. تهيئة... وغيرها 
من مرادفات الكلمة إن وجدت. ويمثل هذا النوع من البحث أهمية AL‏ في البحث 
عن الصور حيث يمكن التعبير عن الصورة بالكثير من الكلمات. ويعد محرك 
الضف ارسي ٠‏ من Lal‏ أدوات البسف (feat Gil aaa yall‏ با تكد ام Suits‏ 
التحليل الصرفي.بما يمكن معه إنتاج آليات بحث مش البحث بالمترادفات. 
۳ البحث بالمتضادات 

يستخدم المستفيدون هذا الشكل في البحث من أجل استرجاع مجموعة 
الوحدات التي تتعلق بالكلمات ومتضاداتها. وعلى ذلك. فإذا ما رغب المستفيد في 
البحث عن كلمة (السلام) ‏ ويختار البحث بالمتضادات. فإن نظام الاسترجاع 
يستدعي أيضًا كلمة (الحرب) وغيرها. وهذه الطريقة ربما تكون مفيدة في البحث 
في النصوص. حيث تأتي كلمات مرتبطة ببعضها مثل (الحرب والسلام) o‏ 
و(الأبيض والأسود) e‏ و(الخير والشر) و(الجنة والنار) » ولكن بالنسبة للصور. فإن 
هذا ربما يستدعي صورًا مخالفة لما هو مطلوب. وأفضل أدوات البحث العربية في 
ذلك محرك البحث الإدريسي. 


۳ البحث بالمعاني 

يوفر استخدام التحليل الصرفي البحث بالمعاني المتعددة التي توجد عليها 
الكلمة في اللغتين العربية والإنجليزية. ويعتقد الباحث أنه لا يوجد الكثير من 
www.alidrisi.com O)‏ 
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يستخدمها لبحث موضوع ما. وقد pic‏ الباحث عن هذا الشكل في خاصية البحث 
المتقدم لمحرك بحث عربي هو (عجيب «www.ajeeb.com‏ ومع استخدام كلمة البحث 
(سيد) خرجت النتائج متضمنة كلمات تحمل معنى السيد أو السيادة بجانب 
استرجاع الوحدات التى تتضمن كلمة البحث ذاتها. 
/1/Y/Y/Y‏ التعرف إلى الأخطاء العربية الشائعة 

يقصد بهذا الشكل من البحث التعرف إلى الأخطاء التي توجد عليها كلمات 
اللغة العربية سواء في بناء النص واسترجاعه. وللغة العربية طبيعة تختلف عن تلك 
اللغات الغروية أو اللصقية مثل اللفات اللاتينية والإنجليزية. وتعد الهاء الختامية 
والتاء المربوطة والياء المقصورة وهمزة الوصل والقطع من أكثر الأخطاء légi‏ 
بين الكتاب والمستفيدين. ومثال ذلك فإن كلمة (احمد) تسترجع معها الشكل الآخر 
من الهمزة وهو (أحمد). ويجب في هذه الحالة تعطيل خاصية البحث بحساسية 
الأحرف؛ لأنها تعمل بشكل عكسي لهذا النوع من البحث. 
۳ آليات البحث بكلمات متعددة 

عند استخدام البحث بالكلمات المتعددة. يستقي المستفيد من إدراكه 
بالموضوع مجموعة من الكلمات التي تتكامل Lia‏ لأجل التعبير عن الموضوع: وكلما 
زاد عدد الكلمات كان ذلك أحرى بتضييق نطاق البحث ومن ثم زيادة التحقيق. 
واليات البحث المستخدمة مع الكلمات المتعددة هي :- 


۳ البحث في الحقول 

يستخدم المستفيد في هذا الشكل من البحث مجموعة من الحقول المعدة 
GL.‏ في محرك البحث وعادة تكون هذه الحقول محدودة أو بمعنى آخر شائعة 
الاستخدام كأن يبحث المستفيد في حقل المؤلف أو العنوان أو الناشر أو السنة, 
وفي التسجيلة oor‏ للصورة يمكن البحث عن صورة محددة بتكامل حقولها Lae‏ 
في البحث. وتستند إستراتيجيات البحث بحقول التسجيلة إلى دعامة المنطق 
البوليني في "e‏ العلاقات بين الكلمات في الحقل الواحد وبين الحقول المختلفة 
وبعضها الآخر. وتحدد المعاملات العلاقات التالية؛ فعند استخدام معامل البحث 
AND‏ يرمز ذلك إلى الجمع بين الكلمتين أو الحقلين في الوحدات المسترجعة» مما 
يكون له أثر تضييق نطاق البحث. Lal‏ معامل OR‏ فيرمز إلى الحصول على أي من 
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الحقلين أو الكلمتين داخل الوحدات المسترجعة؛ مما ينتج dic‏ توسيع نطاق البحث. 
أما المعامل الثالث هو NOT‏ فيرمز إلى إبعاد الكلمة أو الحقل من بين الوحدات التي 
يتم استرجاعها. 


۳ صياغة الجملة البحثية 


تتيح بعض محركات البحث للمستفيد حرية صيغة الجملة البحثية بشكل 
أكثر مرونة من تلك الموجودة في الحقول حتى يصل بها إلى الصورة المطلوبة؛ 
وبالتالي. فإن صورة ملونة عن القدس التقطها فنان محدد في وفت محدد يجعل 
لهذه الصورة الأهمية الكبيرة. يسعى المستفيد إلى صياغة إستراتيجية بحث من 
حقول ثابتة يصل بها إلى الصورة المطلوبة. وتكون هذه الإستراتيجية على شكل 
.SU=() or SU=() and Au=() and CO=(color) and DT=(1948)‏ حيث su‏ الموضوع. au‏ 
الفنانء de‏ التاريخ. co‏ اللون. ويمكن في هذا النوع من البحث استخدام معاملات 
إضافية غير معاملات المنطق البوليني مثل معاملات حالة المجاورة بين كلمات 
البحث. والبحث بائتقارب في إحدى حالاته يستخدم عنصر التطابق بين SLAS‏ 
البحث المدخلة والنتائج المسترجعة ؛ حيث تحتوي النتائج على نفس الكلمات 
والترتيب التي تم البحث بها. OSS‏ الاختلاف بين هذين الشكلين wk‏ في الحالات 
الأخرى من مدى التقارب المطلوب بين الكلمات» ويستخدم نظام الاسترجاع 
معاملات للتحكم في البحث مثل )* (near‏ ويعني فريبًا بدرجة محددة وفقا لما يكون 
عليها عدد العلامات *. adjacent, allowed by Lal‏ يعني بجوار أو ملتصقًا ويستخدم 
في ربط كلمات البحث معا. ويؤثر البحث بالتقارب في ترتيب النتائج النهائية وليس 
فقط استدعائها. فكلما كانت كلمات البحث متقاربة اقتربت Gling‏ المعلومات إلى 
الأرقام الأولى لنتائج البحث. 
“7 استخدام علامات التطابق 

يستخدم هذا النوع من البحث للتأكيد على استخدام الكلمات المطلوب 
البحث عنها بنفس الترتيب المدخلة به. وتستخدم محركات البحث علامتي 
التنصيص ليلزم نظام الاسترجاع باستدعاء النتائج مشتملة على كلمات البحث 
بنفس الترتيب المدخلة به. مما يعني ضمنًا اختيار المستفيد لخيار التطابق بين 
كلمات البحث المدخلة والنتائج المسترجعة من النظام. 
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۴۳ البحث المعقد أو المركب 

لا يعد البحث المركب أو المعقد أحد أشكال المعالجة في اللغة العربية» إنما 
يعد هذا الشكل استخدامًا لمجموعة من أشكال البحث السابقة في صياغة 
إستراتيجية واحدة للبحث داخل نظام الاسترجاع. ويأتي استخدام هذا الشكل في 
بحث الموضوعات التي تحتوي على جوانب موضوعية مختلفة. مثال ذلك كأن يكون 
البحث عن مصادر تتوفر فيها الشروط التالية مجتمعة. وهي أن تحتوي على أي من 
الكلمات: A195)‏ جمهورية. مملكة. alalu‏ حكومة) بمترادفاتهاء وأن تحتوي على أي 
من الكلمات: (صحافةء إعلام. رأي) بلواصقهاء إلى ile‏ أن تحتوي على كل 
الكلمات: (عرب» سجن) بمشتقاتهاء وفي ld‏ البحث لا تحتوي على كلمة 
(إسرائيل) بلواصقها. وبتطبيق النظام لهذه الشروط Lae‏ فإنها تؤدي إلى الحصول 
على مصادر خاصة بحرية الرأي والصحافة في البلدان العربية. 


ويتكامل 2 nic‏ | الوصف المادي والوصف الموضوعي مع آليات بحث النص 
العربي في تكوين نظام استرجاع للصور باللغة Au pall‏ من شأنه إفادة الباحثين عن 
أوعية الصور للأغراض المعلوماتية المختلفة. وتأتي مقاييس استدعاء التحقيق 
والشوشرة ضوابط تحسن من أداء نظم استرجاع الصور. يتعرف المستفيد ومصمم 
النظام على مدى الكفاية التي يعمل بها محرك أو قاعدة بيانات الصور. والفصول 
التالية تعرض Aine!‏ من محركات الصور وخصائص الإضافة والتكشيف والبحث 
داخلها. كاشفة عن العناصر الأخرى المكملة لأداء محرك البحث من واجهات 
وعرض النتائج... الخ. 
Y/Y/Y/Y‏ أساليب بحث أخرى متطورة 

طورت نظم الاسترجاع من أساليب البحث التقليدية المستخدمة في معظم 
محركات البحث وذلك من خلال استخدام أساليب أخرى SI‏ مرونة من أهمها: 
۳ البحث بصيفة توسيع السؤال 

يتم هذا الشكل من البحث بأن يقوم الباحث بكتابة الكلمة أو الكلمات التي 
يرغب فيها ثم بعد الحصول على النتائج يتاح للباحث الاختيار من بين نتائج البحث 
الأكثر مطابقة لاحتياجاته. ثم يقوم بإجراء البحث مرة أخرى» وعندها يقوم محرك 
البحث بإضافة الكلمات الموجودة في نتائج البحث المختارة والبحث بها لاستدعاء 
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نتائج أخرى أكثر دقة. ويفيد هذا النوع من البحث في محركات بحث الصور بدرجة 
كبيرة. حيث إن البحث قد يأتي بصور ليس لها أي علاقة برغبة المسفيد ولكن 
عند اختيار مجموعة من الصور وإجراء البحث مرة أخرى يمكن أن تضاف الكلمات 
المفتاحية المصاحبة لها إلى الجملة البحثية واستدعاء صور أكثر aalas‏ لرغبة 
الياحث. 
۳ البحث بوزن الكلمة 

قد تنصرف نظم الاسترجاع إلى احتساب تردد الكلمات لحساب الأهمية 
التي يكون عليها مصدر المعلومات في تلبية المعلومات موضع البحث. أيضًا فإن 
نظم الاسترجاع تحتكم إلى مكان الكلمات المفتاحية فى مصادر المعلومات سواء في 
العنوان أو الرموز المعيارية... الخ؛ إلا أن البحث بتقدير الأهمية يعطي المستفيد 
إفكانية الأسترجاع بحسب أهمية الكلماكالمفتاحية الت Oeil doa teed‏ 
وهذا النوع من البحث أكثر مناسبة مع الكلمات المصاحبة للنص منها لتلك 
المصاحبة للكلمات المفتاحية 

تعتمد فكرة البحث بوزن الكلمة على مطابقة الكلمات الواردة في عنوان 
الوثيقة أو النص مع GLAS‏ الواردة في السؤال و إعطاء كل كلمة منها Us‏ بحسب 
أهميتها و ذلك وفق الخطوات التالية : 
.١‏ يقارن النظام بين الكلمات الواردة في السؤال و الكلمات الواردة في النص أو 

العنوان. 


Y‏ تستبعد الوثائق التي لا تحتوي على أي paie‏ من عناصر السؤال. 

Y‏ ترتب الوثائق التي تحتوي على عنصر واحد أو عنصرين أو أكثر من عناصر 
السؤال حسب وزن الكلمات الدالة فيها و يتم حساب وزن الكلمات بإحدى 
الطريقتين:- 
# في النظم البسيطة تعطى الكلمة قيمة (Y)‏ إذا كانت تحتوي على 

عنصر ورد في السؤال و عنوان أو نص الوثيقة.و قيمة (pua)‏ إذا لم 
تكن في العنوان أو النص و بالتالي يحسب النظام وزن الوثيقة 


.٠١ إرشادات البحث في الإدريسي. مصدر سابق. ص‎ )١( 


— NW" — 


الإجمالي بالنسبة لطلب معين بعدد الكلمات المتوفرة بها من مجموع 
الكلمات الدالة المطلوبة في السؤال و ترتيب الكلمات الأكثر ملاءمة أو 
مضاهاة إلى الأقل ملاءمة أو مضاهاة. 

» في النظم المتطورة يقوم الباحث بإعطاء وزن لكل كلمة يعبر من 
خلالها عن أهميتها بالنسبة له و يحسب وزن الوثيقة و مدى ملاءمتها 
للطلب بالنسبة إلى عدد الكلمات المتوفرة وأوزانها المختلفة في السؤال 
ويحسب الوزن كما يلي :- 
وزن الكلمة أ في الوثيقة X‏ وزن الكلمة أ في السؤال + وزن الكلمة ب 
في الوثيقة ا وزن الكلمة ب في السؤال. 


.٤‏ تحسب أوزان الكلمات الواردة في السؤال VE‏ متناسبة Ée‏ مع معدل تواتر 
الكلمة في مجموعة النصوص في تخصص واحد أي أن الكلمة نادرة 
الاستخدام في مجموعة النصوص يفترض أنه تعبر بدقة أكبر عن dale‏ 
الباحث من تلك الشائعة في الاستخدام. 


tao AJI ”/“ 

تتسم الصور الرقمية بمجموعة متنوعة من ملامح الوصف التي تختلف بين 
وصف الشكل إلى وصف محتوى الصور بجائب ملامح وصف ملف الصور في ذاته 
مثل حجم ونوع ملف الصورة. وقد تبنت الدراسة معيار دبلن كور للمعالجة الفنية 
للصور الرقمية على الويب. غير أن المعالجة الفنية للصور الرقمية لا تتوقف فقط 
عند الوصف الماديء و إنما تتعدى إلى تحليل محتوى الصورة بعناصره المختلفة, 
وقد اعتمدت الدراسة على تبني نموذجين من الصورة لتحليلهما بما يوضح ملامح 
تكشيف الصور الرقمية على الويب. وتأتي اللغة العربية لتمثل البيئة التي يعمل بها 
محرك البحث ؛ حيث يتم التعرف إلى طبيعة ما تحمله aall‏ العربية من خصائص. 
إلى التعرف إلى التقنيات و آليات البحث التي تحل بها اللغة العربية مشكلاتها في 
البحث على الويب عامة و بحث الصور خاصة. 
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الفصل الرابع 
محركات بحث الصور 


٠/4‏ التمهيد 

4 أآليات البحث في محركات الصور 

٤‏ خصائص محركات بحث الصور 

/t‏ خدمات محركات بحث الصور 

4 كفاية ple piu!‏ محركات بحث الصور 
o/t‏ الخلاصة 


,+ 0 0 
کړه ~ *« 


4 التمهيد 

تشترك كل من محركات بحث الويب والمحركات محددة البحث في السمات 
العامة لعمل محرك البحث في شكله التقليدي وذلك فيما يتعلق بالبحث الخارجي 
للمصادر. الننظيم ires dis‏ إلا أن هناك oaa cua. uie‏ العمل التي 
تختلف بين طبيعة بحث فضاء الويب وبين الملفات الرقمية التي تعتمد على تحديد 
آليات البحث المسبق؛ مثل الاعتماد على بعض حقول تخزين واسترجاع المعلومات أو 
البحث في حقول Meta Tags‏ . وسوف يتناول هذا الفصل اليات العمل في محركات 
البحث وخصائصه. وخدماته وكفاية الاسترجاع به. 


4 أليات البحث في محركات الصور 

يعتمد هذا القسم على التفريق النوعي بين محركات بحث العينة جميعها 
وبين محركي البحث Gus ‘Corbis, Freefoto‏ إنهما يمثلان نوعًا خاصا من محركات 
بحث الصور يقترب في درجة عمله إلى درجة قواعد البيانات. هو ما نتج عن 
استخدام العنصر البشري في هذين المحركين. 
4 أليات البحث العامة 

تعتمد محركات البحث بصفة عامة ومحركات بحث الصور بصفة 
خاصة على استخدام نوعين من أشكال استرجاع محتوياتها من مصادر 
المعلومات. يستخدم أول الأسلوبين في عرض محتويات قاعدة بيانات محرك 
البحث أو نظام الاسترجاع بالاعتماد على وضع تقسيم لموضوعات قاعدة 
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البيانات اعتمادًا على استخدام المصطلحات ورؤوس الموضوعات كما في حالة 
selga‏ البيانات النصيةء أو استخدام تمثيل pisas‏ لمصادر المعلومات نفسها 
وخاصة المعلومات المرئية كما في حالة عرض لقطات صغيرة من الصور. على 
هذا الأسلوب اسم التصفح أو التقسيم الموضوعي والذي يعتمد في أغلب 
الأحيان على Abs‏ تصنيف لموضوعات المعرفة Jis‏ خطة تصنيف £929( 
العشري أو خطة التصنيف العشري العالمي. أما الأسلوب الآخر في البحث فهو 
الاعتماد على البحث الحر المتمثل في استخدام الكلمات المفتاحية من جانب 
المستفيد دون التقيد بمصطلحات محددة يعرضها نظام الاسترجاع كما في 
تقسيم المصطلحات السابقة» ويرتبط بهذا الجانب استخدام تقنيات واليات 
بحث تلائم الصيغ المختلفة التي يدخل بها المستفيد استفساره إلى قاعدة 
البيانات. خاصة تلك التي تعمل بلفات عالية الدقة مثل اللغة العربية. إن 
التقسيم بين أساليب البحث في أدوات بحث الويب هو الأصل الذي يبنى عليه 
الفارق بين محركات البحث وأدلة البحث. فان محركات البحث تعتمد على 
التكشيف الكامل لصفحات الويب. مما يسهل البحث الحر بالكلمات المفتاحية 
بخلاف ما تكون عليه أدلة البحث من الاعتماد على التكشيف الإنساني الذي 
يصف الموضوع في مصطلحات محددة يلزم المستفيد بالبحث بها من خلال 
قوائم الموضوعات مختلة التخصص والمتفرعة بعضها من بعض. 


ويتعرض الفصل هنا إلى استخدام كلا الأسلوبين في محركات بحث 
الصور والكفاية التي يمكن أن يعمل بها كلا النوعين. ولم تعتمد مجموعة 
محركات بحث الويب على استخدام أسلوب التصفح في تنظيم واسترجاع ملفات 
الصور الرقمية. وإنما يرجع ذلك إلى الطبيعة العامة لمحرك البحث التي 
يتبناها في تنظيم واسترجاع جميع أشكال مصادر المعلومات على الويب. على 
الرغم من أن الكثير من محركات بحث الويب العامة فد لجات إلى استخدام 
صيغة دليل البحث للجمع بين الحسنيين؛ اسلوب التصفح الرئيس من ناحية 
وأسلوب التصفح من ناحية أخرى وعلى رأسها Google‏ ويوضح الجدول رقم 
)1-2( النمط المتبع في كل محرك من عينة الدراسة := 
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الجدول رقم )١-4(‏ يوضح أساليب استرجاع المعلومات لمحركات بحث الويب 


محركات بحث الويب محركات بحث محددة 
محركات البحث : 
Freefoto | Corbis Visoo |Picsearch| Google Fast Ditto | Altavista‏ 
١‏ 
قائمة مصطلحات 
أسلوب واحدة عامة 
التصفح قوائم m‏ ثلاث 
5 0 = قا 5 E DX = ~~ Eu o‏ - 31 
مهد ده mls?‏ 
I‏ مزود rai‏ مزود مزود مزود مزود مزود يقتنصر 
أسلوب الكلمات 8 8 
المفتاحية 
بحث الكلمات بحث cx‏ بحث بحث بحث الكلمات 
L- 85‏ 


ويوضح الجدول رقم )17$( الأساليب المتبعة في استرجاع الصور داخل 
محركات بحث الصور. وترتكز محركات بحث الصور على الكلمات المفتاحية 
كأسلوب أساس للبحث» على حين يتضح الإهمال شبه التام لأسلوب التصفح» وقد 
شذ عن ذلك daas‏ محرك البحث Ditto‏ بالاعتماد على مستويين من الموضوعات 
العامة التي تغطي مجموعات الصور داخله؛ إضافة إلى ان محرك البحث Google‏ لم 
يمتد دليله البسيط إلى التعامل مع ملفات الصور حيث التركيز على تنظيم صفحات 
الويب فقط. وتعتمد محركات البحث على استخدام الكلمات المفتاحية التي تتناسب 
مع طبيعة تكوين فواعد تلك المحركات من خلال التقاط الصفحات بلغتها الطبيعية 
وتحديد نقاط ومداخل استرجاعها بتكشيف النص الكامل لمواقع صفحات الويب. 
وعلى ذلك يمكن أن نخلص إلى أن الفارق بين تلك المحركات يأتي فقط في آليات 
البحث الحر بالكلمات المفتاحية وكيفية صياغة إستراتيجيات البحث لبحث فواعد 
بياناتهاء Shy‏ ذلك في الحديث عن آليات البحث داخل محركات الدراسة. 

كما يتضح من الجدول رقم (=E)‏ أن كلا من محركي البحث قد اعتمد 
على الجمع بين أسلوبي البحث؛ وإنما يرجع ذلك في رأي الباحث إلى التدخل 
البشري لتنظيم ملفات الصور. وتوقع المستوى الأدنى من مهارات مستخدمي الويب 
في التفاعل مع البحث بالكلمات المفتاحية بمفردها. غير أن كلا المحركين لم يغفل 
أسلوب البحث الحر كأسلوب أساس سريع في إجراء البحث عن ملفات الصور داخل 
جميع أنواع محركات البحث. ومن ناحية أخرى فقد جاءت قوائم الموضوعات 
المستخدمة في محركي Freefoto, Corbis‏ على غير الدفة المطلوبة او الحصر الذي 
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يتماشى مع تعدد موضوعات الصور العامة. احتوى أحدهما على قائمة واحدة تضم 
الموضوعات العامة للبحث غير مرتبطة فيما بينها بأي أساس للتقسيم؛ واحتوى 
الآخر على ثلاثة قوائم تضم الأساسية الموضوعات العامة. Lal‏ القوائم الفرعية 
فتضم الموضوعات الفرعية للقائمة الأساسية. 


٤4‏ آلیات البحث بالتصفح 


إن استخدام التصفح بالمصطلحات أو الكلمات المفتاحية يعتمد في أول 
zayi‏ على حجم فاعدة بيانات الصور. فإذا ما كانت فاعدة البيانات تضم 
مجموعات كبيرة من الصورة فإنه من الجدير استخدام إحدى الأدوات الحصرية 
لرؤوس الموضوعات سواء أكانت الكشافات الهجائية لخطط التصنيف al‏ قوائم 
رؤوس الموضوعات. حيث يعمل ذلك على تضييق الموضوعات بدرجة كبيرة أمام 
الباحثين عن المعلومات المتخصصة والصور as pall‏ بموضوع محدد. مما يوفر 
على المستفيد معاركة كلمات البحث المفتاحية والشكل الملاتم منها للبحث. 
والتصفح باستخدام المصطلحات يختلف بدوره عن التصفح باستخدام الصور 
المصفرة. والذي تناسب بطبيعته مع فواعد بيانات الصور ذات الحجم الصغير. 
ومن جانب آخر فإن التصفح باللقطات أكثر ملاءمة للتعرف إلى الأوعية المرئية 
مثل الصور الثابتة. حيث لا يكون النص بمصطلحات أو نص وسيط بين الصورة 
والمستفيد. مما يمكن الصورة بذاتها من أن تعكس مختلف الموضوعات التي 
تحتويها. وختامًا فإن أسلوب التصفح يعد أسلوبًا مساعدًا لمحرك البحث ي 
الاستفادة منه في تدعيم البحث بالكلمات المفتاحية الذي يعد أساس عمل محركات 
البحث ليس فى الاسترجاع وإنما في التكشيف للغة النصوص الطبيعية. 


إن ناتج دراسة أساليب الاسترجاع يفيد أن الصور الرقمية الطبيعية تحتاج 
إلى طبيعة تقسيم تختلف عن مثيلاتها في الصور الإعلامية والصور العلمية؛ 
فالصور العامة تحتاج إلى الاعتماد على خطة تصنيف حصرية يمكن أن تضم 
مجموعات الصور في مختلف الموضوعات. أو أن تكون تلك الأداة هي إحدى قوائم 
رؤوس الموضوعات التي تمكن المستفيدين من متابعة الترتيب الهجائي ومتابعة 
رؤوس الموضوعات المقننة التي تملك الروابط إلى الصور المعبرة عنها في 
المحتوى. غير أنه من المسلم به أن ترتبط الصورة العامة الواحدة بكل رؤوس 
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الموضوعات التي تمثلها نظرًا لطبيعة الصور العامة. كما cle‏ في الجدول رقم )١-4(‏ 
من توضيح لأساليب البحث الأساسية في محركات الصور المحددة. 


15 أآأليات البحث بالكلمات المفتاحية 


تستخدم محركات البحث مجموعة من الآليات التى تساعد المستفيدين في 
صياغة شكل إستراتيجيات البحث عن مصادر معلومات الويب النصية والمرئية, 
واعتمادًا على أن الكلمات المفتاحية هي كلمات ومصطلحات لفظية. فإن La Sb‏ باللغة 
التي يبحث بها محرك البحث تنعكس على مجموعة الآليات التي يتم استخدامها 
لتناسب عملية بحث النصوص. وتختلف اليات بحث كلمات ومصطلحات اللغة العربية 
عن تلك المستخدمة في بحث المصطلحات الإنجليزية. وهو ما يتم دراسته اعتمادًا 
على محركي البحث Google, Fast‏ لتبنيهما اللغة العربية في بحث الصور. 

وتعطي آليات البحث إمكانية التحكم في صنع أشكال مختلفة من البحث 
بمجموعة واحدة من الكلمات او كلمات مفردة. وتختلف إستراتيجيات البحث بدورها 
وطبيعتها عن آليات البحث التي تتكامل لتحقيق أنواع أشكال مختلفة من 
الإستراتيجيات. وتتعدد إستراتيجيات البحث المستخدمة لبحث محركات البحث بين 
البحث الحر بالكلمات المفتاحية واستخدام الحقول في بحث مصادر وصفحات 
الويب. وبنظرة إلى أعلى Mule‏ فإن الويب يتم بحثها من خلال مجموعة مختلفة من 
إستراتيجيات البحث مثل استخدام البحث بالمسار. أو استخدام الأدلة 
الموضوعية,او استخدام محركات وكشافات البحث على اختلاف انواع هذه 
المحركات بين محركات البحث المتخصصة ومحركات البحث العامة أو المتعددة 
التي تبحث في محركات أخرى Meta search Engines‏ أو استخدام فواعد البيانات على 
الويب والتي تعرف الويب الخفية Invisible Web‏ الخدمات التقيميية للمعلومات على 
الويب ومساعدات الويب في الاستشهادات المرجعية. وقد تم حصر مجموعة آليات 
البحث المختلفة مع اختبار تواجد وكفاية تطبيق هذه الآليات في محركات 
NU ERNST PU‏ كل ما ees‏ عليه كركاف السك علق 


Lazewski, Barbara. WWW Search Strategies, University of Wisconsin-Madison, (Y) 
2002, visited 30/11/2002, 
(http://www.library.wisc.edu/libraries/Steenbock/services/wwwstrat.htm) 
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الويب سواء منها التي تبحث في النصوص أو تلك التي تبحث في الوسائط الأخرى, 
كما صدق على كن وجاءت كما يلي :- 

يعتمد الجدول على قياس آليات البحث ثم توضح علامة وجود آلية البحث 
كاملة نشطة في المحرك» اما علامة x‏ فتعني عدم وجود الية البحث على الإطلاق. 


الجدول رقم (Y-£)‏ يوضح آليات البحث المستخدمة في عينة محركات البحث 


آليات البحث محركات بحث الويب محركات بحث محددة 
Free-foto | Corbis Visoo |Picsearch| Google Fast 1 Ditto  |Alta- Vista‏ 
البحث بالتطابق 4" v | x x 4 Y x‏ 2 
البحث الجر (7 ,*( x x x x x V‏ 3-4 2 
البحث حساسية 
الحروف x x x x x x x x‏ 
F T‏ 
المنطق البوليني x 2 x v v x Y | v‏ 
البحث بالعبارات 
والتوقف 4" x x x‏ 
Ni‏ 
البحث ببدائل 
المنطق البوليني 2 2 x Y v 2 x x‏ 
)+3-( 
البحث بالتقارب x x x x x x x x‏ 


ويعطي الجدول رقم (Y-i)‏ المحتوي على محركات بحث الصور وآليات 

البحث المستخدمة مدلولات يمكن توضيحها Lage‏ يلي := 
m‏ استخدم ثلاثة محركات للصور آلية البحث بتطابق الكلمات وهي محركات 
Altavista, Google, Fast‏ ودلت النتائج المسترجعة داخل هذه المحركات على 
استخدام التطابق بأن كانت النتائج في أقل درجاتها وهو ما ينتج عن شدة 
التضييق الناتجة عن استرجاع عدد من الكلمات بعدد وترتيب واحد. وعلى 
الجانب الآخر. فإن استخدام علامات التطابق في المحركات الأخرى تساوى في 


)1( تناولت آليات البحث على الويب مجموعة من الدراسات؛ إلا أن الباحث قد لاحظ التركيز بها على 


مجموعة واحدة من آليات بحث النصوص. ومن المصادر. 
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النتائج المسترجعة مع البحث باستخدام معامل البحث And‏ إن (A9‏ أو الربط 
الذاتي داخل محرك TOV]‏ وهوما s J‏ غياب فاعلية معامل التطابق. 


استخدم محرك Altavista‏ معاملات البحث الحر. ويستخدم هذا المحرك 
معامل البحث # للبحث للتعويض عن الحروف المفقودة في امتداد كلمات 
البحث. وتعتبر معاملات البحث الحر من آليات البحث القوية في محركات 
البحث إذا ما تم توضيحها إلى المستفيدين. ولعل أكثرها إفادة استخدام 
معامل البحث e‏ في نهاية كلمات البحث. ويفضل الباحث استخدام معاملات 
البحث الحر بشكل ثابت في وظائف الاستخدام. ويمكن للمستفيدين البحث 
الحر في التغلب على الأشكال المختلفة من الكلمات التي تشتق من اصل (A15‏ 
وهو أكثر ما يستخدم في GLU!‏ اللصقية مثل اللغات اللاتينية بأنواعها. كما 
يستخدم هذا النوع من البحث إذا ما أراد المستفيدون الابتعاد عن المشكلات 
الهجائية التي تعتري اللفات الأخرى. كما يوضح الجدول رقم (Y7£)‏ استخدام 
محرك rreetoto‏ لمعامل « في نهايات الكلمات وداخل كلمات البحت في حين 
أن معامل 5 يستخدم فقط في داخل كلمات البحث. أما محرك البحث Corbis‏ 
فانه يستخدم معامل البحث e‏ فقط داخل حروف الكلمات. ومن الملاحظ من 
مقارنة نوعي محركات البحث أن محركات البحث المحددة تعتمد أسلوبًا 
خاصًا لآليات البحث خلاف آليات البحث عامة الاستخدام التي تعتمدها 
محركات بحث الويب حيث تتلاءم أكثر مع طبيعة مستخدميها. 


لا توجد محركات بحث للصور تدعم آلية البحث بحساسية الحروف؛ وذلك 
يرجع في رأي الباحث إلى طبيعة محركات البحث العامة في موضوعاتها مما 
لا يجعلها تتوقف عند الجوانب المتخصصة للموضوع الواحد» والذي يمكن أن 
تعكسه حالة حروف المصطلح (الحروف الكبيرة EARTH‏ أو الحروف الصغيرة 
(earth‏ . هذا فضلا عن أن هذه الآلية تحتاج إلى التجهيز الإنساني للمعلومات 
داخل محركات البحث» وهو ما يخالف طبيعة محركات البحث في اعتماد 
منهج وسياسة التكشيف الآلي بالاشتقاق لكامل متن صفحة الويب» مما يعني 
أن وجود الأشكال المختلفة للكلمة الواحدة يتوقف على مصمم وكاتب نص 
الصفحة المكشفة. فإذا عمد كاتب صفحة الويب إلى كتابة الكلمة بالحروف 
الكبيرةء فإن ذلك يعني الإشارة إلى جانب محدد من جوانب الموضوع لا يتم 
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استرجاع الوثيقة به إلا بالتعبير عن هذا الموضوع بالشكل السابق في الوثيقة. 
وقد لاحظ الباحث استخدام بعض محركات البحث مثل Altavista‏ للبحث بآلية 
شكل الحروف فقط عند بحث صفحات الويب» في حين انه لا يتم ذلك مع 
باقي الأشكال سواء أكانت ملفات الصوت أم ملفات الصور الرقمية. وذلك 
إنما يعكس في راي الباحث تبني محركات البحث لمبدا البحث بالشكل 
البسيط لملفات الصور والمتناسب مع إمكانات المستفيدين المتواضعة في 
البحث. بجانب افتقار الصور إلى التقنين والوصف الذي ينتج عنه آليات بحث 


متقدمة للاستدعاء. 


استخدمت أربعة محركات هي Picsearch, Google, Ditto, Altavista‏ من مجموع 
ثمانية محركات. آلية المنطق البوليني في بحث الكلمات المفتاحية داخل 
قاعدة البيانات. دل هذا العدد في بداية الأمر على جنوح محركات بحث 
الصور عن استخدام المنطق البوليني لما يشوبه من نقص ممارسة وكفاية 
لمستخدمي الويب ومحركات البحث خاصة:؛ وقد عملت بعض المحركات مثل 
Google‏ على استخدام معاملات المنطق البوليني بما يتناسب مع مهارات 
المستفيدين المتفاوتة؛ حيث استخدم Google‏ كلمة (JS)‏ مقابلا لمعامل البحث 
And‏ واستخدم كلمة اي من مقابلا لمعامل البحث Or‏ واستخدم كلمة 

ماعدا مقابلا لمعامل البحث Not‏ إلى جانب قيام بعض المحركات بالتعامل 
مع مبدا الربط بين كلمات البحث جميعًا بشكل ذاتي بوضع معاملات dou‏ 
معامل البحث And‏ وقد أوضح اختبار معاملات المنطق البوليني في محركات 
بحث الصور أنه مازالت الثقة بين محركات البحث والمستخدمين لا ترقى إلى 
الإافصاح عن معاملات البحث المتقدمةء كما أن التفلب على ذلك يكمن في 
استخدام مثل هذه المعاملات بالشكل الذي يتقبله المستوى الأقل من 
المستخدمين كما في حالة محرك .Google‏ ويمكن تقديم المساعدة والتوضيح 
Jalas‏ مساعد في فهم هذه المعاملات. إن استخدام معاملات المنطق 
البوليني من اهم مظاهر القوة في البحث داخل محركات البحث مما لا يتسم 
بغياب مثل تلك المعاملات في بحث مصادر المعلومات» وخاصة أوعية الصور 
الثابتة التي تحتاج في أغلب الأحيان إلى نص شارح لمختلف موضوعات 
الصورة الفوتوغرافية. ولقد سارع محرك البحث Corbis‏ إلى اللحاق بتقدم 
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عمليات البحث على الويب. وقد اعتمد Corbis‏ على إضافة آلية لبحث بالمنطق 
البوليني التي لم تكن إحدى آليات بحثه. حيث تم تفعيل معاملاته المختلفة 
and, or, not‏ بمفاهيمها. وذلك يعكس الثقة Yl‏ 3252 في التزايد بين قدرة 
محركات بحث الويب وبين مهارات مستخدميها. 


توقف محركا Picsearch, Visoo‏ عن العمل بآلية البحث بالعبارات وهو ما ظهر 
في اختلاف النتائج بين طرح كلمات البحث adla‏ من بعض الحروف. وطرح 
الكلمات نفسها في سياق سؤال للبحث. على الجانب الآخر فقد عملت 
محركات pgb Altavista Google, Fast, Ditto‏ ذلك باختبار أعداد النتائج التي 
تساوت بين طرح كلمات البحث مفردة وبين طرحها في سؤال بحث يحمل 
داخله مجموعة من أدوات الربط بين الكلمات. وتعامل محرك daas Corbis‏ مع 
البحث بالعبارات حيث أهمل محرك البحث الحروف وكلمات الربط بين كلمات 
البحث ولم يؤثر ذلك على أعداد نتائج البحث. 


استخدمت بعض محركات البحث معاملات المنطق البوليني على الشكل غير 
المعهود لتلك المعاملات. وقد فضل الباحث الحديث عن تلك المعاملات نظرًا 
لشيوع استخدامها بين محركات بحث الصور خاصة ومحركات البحث عامة. 
ويرجع الباحث استخدام محركات البحث لهذه الآليات إلى الثقة غير العادية 
في قدرة مستخدمي محركات البحث على التعامل الصريح مع معاملات 
المنطق البوليني. وتتركز بدائل المعاملات البولينية في (+) حيث يعمل 
المعامل الأول (+) على أداء مهمة And‏ في الربط بين كلمات البحث الواحد 
لاسترجاعها مجتمعة في وحدة معلومات واحدة. Lol‏ معامل (-) فإنه يعمل 
على أداء مهمة Not‏ في إبعاد ما يليها من كلمات مفتاحيه والحصول على 
وحدات معلومات لا تحتوي على هذه الكلمات. وإذا ما اعتمدت محركات 
البحث على معاملات المنطق البوليني الأساسية, فلا حاجة لها لاستخدام مثل 
هذه الآليات. ويتضح من الجدول رقم (5-4) لآليات البحث أن اثنين من هذه 
المحركات Picsearch, Ditto‏ يعتمدان على تدعيم المنطق البوليني بمثل هذه 
المعاملات كي يتيحا للمستفيدين الصياغة البسيطة لإستراتيجيات البحث. في 
حين أن محرك البحث Altavista‏ لا يعتمد على المنطق البوليني في البحث. 
إضافة إلى استخدامه للمعامل البديل )+( للربط بين كلمات البحث؛ ويعكس 
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ذلك لجوء مثل هذه المحركات إلى أبسط درجات البحث وأقليا كفاية في 
الربط بين مختلف الكلمات الداخلة لفراغ البحث دون النظر إلى الآليات 
الأخرى التي ترفع من كفاية الاستدعاء والتحقيق للنتائج المسترجة. ولا تعتبر 
مثل هذه المعاملات بالمهمة إذا ما استمر التعامل المتزايد ولمتقدم مع 
محركات البحث. بل أن الأمر يستدعي التحرك السريع من لدن محركات 
البحث لتحديث وإيجاد آليات بحث أكثر كفاية. مما هي عليا الآن. ويعد 
استخدام معامل الربط + من جانب Corbis‏ هو البديل التقني لوحيد لدى 
محرك البحث لاسترجاع نتائج تتعلق بموضوع مكون من أكثر من كلمة؛ إذا ما 
لم يتم اعتماد آلية المنطق البوليني في بحث مجموعاته من الصو الرقمية. 
لم تستخدم أي من محركات بحث العينة السابقة معاملات البحث بالتقارب. 
ويرجع الباحث هذا إلى الدرجة المتقدمة من البحث التي تعمل بها هذه الآلية 
والذي لا يتناسب حتى الآن مع مستخدمي محركات بحث الصورء التي مازالت 
برمتها تماني من النقص في مختلف جوانبها سواء كان البناء أر التنظيم أو 
عملية الاسترجاع مرة اخرى. ويرى الباحث أن اهمية معامات البحث 
بالتقريب تزداد Lagi‏ بعد الآخر؛ ذلك لما نراه من إمكانات فائقة ,متزايدة في 
بحث النص الكامل لصفحات الويب وهو ما تعمل به برامج التكشيف في 
محركات البحث, وتزداد فاعلية البحث بالتقريب أكثر من معاملات And‏ و+ 
للربط في أن المعاملات السابقة تستدعي الوثائق التي تحتوي على كلمات 
البحث بدون الحكم إلى مدى التقارب بين المصطلحات الذي بتسع باتساع 
النص الكامل لصفحة الويب. 


وقد أظهر الملحق رقم 5 من ملاحق الدراسة نتائج البحث من وحدات 


الصور حسب آليات البحث المستخدمة. 


٤4‏ آليات البحث النوعية 


الصور. ونتمثل فيما يلي:- 


4 البحث بالتغطية الزمنية والمكانية لوحدات الصور 


يهدف الباحث من عرض التفطية الزمنية والمكانية إلى إشراك سنوات 


on 


وأماكن نشر الصور الرقمية على الويب. وقد أكدت بعض محركات البحث القليلة 
تلك الآلية مستندة إلى ما تتبعه قواعد البيانات على الويب. تستخدم تلك الآلية 
مجموعة من المعاملات مثل < ,€ و= < ,2 > التي ub‏ الكلمات المفتاحية 
وتسبق تواريخ النشر لوحدات المعلومات. ويعد اعتماد محركات بحث الصور على 
آلية البحث بحقول الوصف الببليوجرافي يجمع حقول النشر بمكانه وتاريخه» مما 
يجعل من السهل التخلي عن عزل التغطية الزمنية والمكانية. ويعمل محرك بحث 
الصور Corbis‏ على استخدام الية البحث بالحدود المكانية أو الجغرافية بالاعتماد 
على إحدى القوائم المنسدلة التي تضم مجموعة من الدول هي الولايات المتحدة 
والمانيا وفرنسا واستراليا والمملكة المتحدة واليابان. إضافة إلى اعتماد التفطية 
الزمنية لملفات الصور وفتراتها التاريخية التي تغطيها في المحتوى وتاريخ التحول 
إلى الشكل الرفمي. 


ويتضح مما سبق أن محركات البحث المحددة قد اعتمدت فقط على آليات 
بحث أقل مقارنة بمحركات بحث الويب ويمكن إرجاع ذلك إلى أن هذا النوع يعمل 
في نطاق محدود مع ملفات الصور ومجموعات محدودة العدد من ملفات الصور 
الرقمية إلى جانب عمومية الموضوعات داخلهاء وذلك خلاف محركات بحث الويب 
التي تتعامل مع أنواع شتى من مصادر الويب مثل صفحات الويب والصور ولقطات 
الفيديو... وغيرها. مما يتطلب معه الاعتماد على أنواع عدة من آليات البحث 
بالكلمات المفتاحية lag‏ لطبيعة محرك البحث. فضلا على أن كلا النوعين من 
محركات البحث لم يعتمد الشكل الكامل من آليات البحث. وهو ما يعد أهم جوانب 
النقص التي تتصف بها محركات بحث الويب بصفة عامة؛ حيث مازالت تنظر إلى 
المستوى الأقل مهارة من مستخدمي الويب. 


4 البحث بالمسار أو العنوان 


يعد البحث بالمسار أو العنوان أول سبل الوصول إلى مصادر المعلومات على 
الويب. ويعد أسهل السبيلين وصولا إلى المعلومات؛ حيث يعتمد السبيل الثاني على 
استخدام محركات البحث كوسيط بين المستفيد ومصدر المعلومات الرقمي على 
الويب. وتخصص الإصدارات المختلفة من متصفحات الويب فراغا يسمى بفراغ 
البحث بالعنوان والذي يختص بالبحث عن مسار المعلومات التي يطلبها المستفيد 
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سواء كانت موقعًا قائمًا بذاته أو إحدى صفحات الويب التي تنتمي أو لا تنتمي إلى 
أحد مواقع الويب. ولا حاجة للمستفيد بأي من المعلومات الأخرى عن مواقع الويب 
إذا ما علم بمسار تواجده. وتعامل محرك واحد فقط من محركات العينة السابقة 
وهو Google‏ مع هذه الآلية. في حين أهملته محركات البحث الأخرى. ولم يكن ذلك 
التعامل في بحث مستقل عن الآليات الأخرى وإنما جاء ذلك كمساعد لأداء مهام 
الكلمات المفتاحية. وإذا ما وصل الباحث إلى الصور الموضوعية المحددة ما كان 
له في العودة لهذه الصور سوى البحث بمسارات صفحات الويب المشتملة على تلك 
الصور المحددة. 


14 البحث باستخدام حقول الوصف الببليوجرافي 


يقصد بالبحث بالحقول هنا الاعتماد على رموز حقول الوصف الببليوجرافي 
في استرجاع وحدات من المعلومات تشترك في مجموعة من الحقول مثل تاريخ نشر 
محدد أو مؤلف واحد أو سوشوع مخحسحص. وتأتي آلية البحث بحقول الوصف LG‏ 
لاعتماد محركات البحث على وضع تسجيلات ببليوجرافية لما تحويه من مصادر 
المعلومات سواء أكانت هذه المصادر صورًا أو نصوصًا في أشكال مختلفة. ولا 
تعتمد محركات البحث على الويب حتى الآن على صياغة شكل واحد للتسجيلة 
الببليوجرافية في قواعد بياناتهاء ويرجع هذا في رأي الباحث إلى أن اعتماد 
محركات البحث على برنامج المكشف في تكشيف صفحات الويب لا يضع لمثل هذه 
الصفحات المكشفة سوى الكلمات المفتاحية بما يهمل معه الوصف العام لجوانب 
صفحة الويب. وما يساعد على ذلك أن برنامج الزاحف يعمل على ضم نسخة من 
صفحات الويب المضافة إلى قاعدة بيانات محركات البحث. وقد ظهر هذا جليًا في 
استرجاع صفحات الويب التي تنتمي إليها الصورة عند عرض التسجيلة الكاملة 
للصورة. 


ولم تستخدم محركات بحث الويب آلية البحث بحقول الوصف 
البيليوجرافي بالشكل الكامل لاستخدام الحقول الببليوجرافية. وقد جاء 
الاستخدام الفالب لعناصر البحث الإضافية مثل الحجم واللون والخلفية باعتباره 
جزءًا مكن من واجهة البحث المتقدم داخل محركات البحث. حيث استخدمت 
محركات البحث au! Google, Altavista, Picsearch, Fast‏ الحقول على استحياء من 
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عدم وجود التسجيلات الكاملة أو الشكل الكامل للوصف الببليوجرافي داخل 
قواعد بياناتها. وتوارد البحث في الحقول في كل محركات عينة الدراسة على 
حقول معدودة مثل اللون color or black & white‏ والحجم من خلال القوائم 
المنسدلة ونوع الملف الذي يحوي الصورة الرفمية سواء كان «GIF, JPG, PNG‏ وقد 
استخدم Google‏ آلية الحقول عن طرق العبارات التي تشير إلى تحديد النتائج. 
وما سبق لا يصل إلى ما يهدف إليه oet‏ مداه آلية تدعم البحث 
بالحقول الوصفية للصور الرقمية والتي تساعد استرجاع الصور بالكلمات 
المفتاحية. يعد النقص السابق لآلية البحث بالحقول أهم نقاط ضعف محركات 
بحث الصورء ويمكن أن تضع Jia‏ هذه المحركات برنامجًا آخر يعمل على 
استقطاب clau‏ وخصائص الصرر المادية من ملفات الصور الرفمية Lo‏ 
يسمح بتجميعها فيما بعد واستخدامها متجمعة في شكل تسجيلة ببليوجرافية 
تكون الصور أحد العناصر المكونة لها. تتيح التسجيلة الببليوجرافية لمحركات 
بحث الصور الفوز بالحسنيين في العمل كشتوامد بيانات محكمة تعتمد على 
العنصر البشري» إضافة إلى السرعة في التحديث والشمول والسعة التي تميز 
محركات البحث على الويب. وقد أعطى الباحث في الفصل الثالث الشكل 
المقترح لما يمكن أن تكون عليه التسجيلة الببليوجرافية للصور الفوتوغرافية 
الرقمية على الويب. بما يمكن أن تستخدم polic‏ هذه التسجيلة في استرجاع 
وحدات المعلومات من الصور الرقمية. ويعتمد Corbis‏ على يعض العتاصر 
البسيطة التي تستخدم كمحدد لبحث مجموعاته مثل عناصر اللون وقطاع 
البح Lii]. etc... news, commercial, entertainment (Jie‏ الصور داخل أو خارج 
حق النشر ثم نوع ملف المادة بين صورة فوتوغرافية أو إيضاحات مرسومة. 


14 البحث بخصائص اللفة العربية 
يعتمد id mA‏ آليات اللفة العربية على محركات بحث الويب 
daza‏ حيث لم 3 تستخدم محركات البحث المحددة آليات التعامل مع اللغة العربية ؛ 
وذلك يرجع إلى طبيعة بناء المحركات المحددة الذي يتسم بالتحكم البشري 
والمراجعة المحكمة لمجموعات ملفات الصور المضافة. خلاف ما يكون عليه 
محرك بحث الويب في إطلاق برنامجه الزاحف crawler‏ في فضاء الويب للتعامل مع 
شتى أنواع ولغات مصادر الويب. 
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وتختلف اللفة العربية عن غيرها من اللفات الأخرى في عمليات تنظيم 
المعلومات. حيث درجة المرونة المطلوية لتنظيم واسترجاع المعلومات. ومن ثم فإن 
آليات بحث المعلومات داخل اللغة العربية تختلف عن تلك المستخدمة في اللفات 
الأخرى مثل GLAU!‏ اللاتينية على أنواعها المختلفة. ودخل استرجاع اللغة العربية 
إلى عهد جديد معتمدا على تقنيات التحليل الصرفي والمعجمي لألفاظ وتراكيب 
ay pall aall‏ وانتفت مع هذه التقنيات معظم مشكلات الاسترجاع الآلي للمعلومات 
في اللغة العربية. اعتمدت بعض محركات البحث العامة باللغة العربية على مثل تلك 
التقنيات. ومن أهمها محرك ajeeb‏ الذي انعكس استخدام تقنيات التحليل الصرفي 
به في اليات البحث بالمعنى والمشتقات والجذر والمترادفات. 

وحري بالذكر هنا أنه لا توجد محركات بحث للصور تعمل باللفة العربية 
من Aine‏ الدراسة سوى .Google, Picsearch, Altavista, Fast‏ وسيتم بالاعتماد على تلك 
المحركات دراسة خصائص استرجاع الصور في بيئة اللفة العربية. ويوضح الجدول 
رقم (Y-t)‏ آليات البحث في اللغة العربية وتطبيقها في محركات بحث الصور على 
الويب:- 


الجدول رقم (Y-£)‏ يوضح آليات بحث اللغة العربية في محركات بحث الصور 


محركات بحث الويب محركات بحث محددة 
Free-foto | Corbis Visoo  Picsearch| Google Fast Ditto |Alta- Vista‏ 
البحث التطابق | ”ا = 4 an PE x v‏ == 
البحث غير 
المطابق x x x -- x‏ -- -- -- 
باللواصق 
البحث بجذر 
a5 -- x x x -- x‏ -- 
الكلمة 
البحث بالتشكيز x x x -- x‏ -- -- -- 
البحث الحر x x x -- x‏ -- -- -- 
البحث بالترادف x x x -- x‏ -- ~- -- 
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تابع ‏ الجدول رقم (Y-£)‏ يوضح أليات بحث اللفة العربية في محركات بحث الصور 


محركات بحث الويب محركات بحث محددة 
Free-foto | Corbis Visoo |Picsearch| Google Fast Ditto  |Alta- Vista‏ 
J‏ | 1 1 
Carel‏ 
x x x -- x 1‏ -- -- -- 
بالمتضادات 
-" 
البح بالمعاني x x x -- x‏ 
ail‏ 350 بالترجمة x x x 5 x‏ 
التعرف إلى 
x x x sz x 8 t‏ -- -- -- 
الشائعة 
L 1‏ 


وتحتاج اللغة العربية إلى مجموعة من آليات البحث كتلك المشار إليها في 
معالجة اللغة الطبيعية في النصوص العربيةء ولم تزل محركات بحث النصوص 
العربية تعمل بآليات بحث عامة تتوافق مع الكلمات المفتاحية في مختلف اللفات 
الأخرى؛ مثل آليات المنطق البوليني. والبحث الحرء والتطابقء والبحث بالتقارب... 
وغيرها من الآليات الأخرى. ولقد عملت المحركات العربية Eras‏ على استخدام 
التقنيات المساعدة في بحث اللغة العربية مثل تقنيات التحليل المعجمي والتحليل 
الصرفيء ولا يمكن بحث النصوص العربية المستقلة أو التابعة لوسائط الصور 
والصوت دون الاعتماد على التقنيات السابقة. لقد خلت محركات بحث العينة 
السابقة حتى المستخدم للعربية منها من آليات بحث تعمل Lanas‏ لبحث وحل 
مشكلات استرجاع المعلومات من النصوص العربية. نظرًا لخلوها من تقنيات 
التحليل الصرفي والتحليل المعجمي. واعتمادًا على التقنيات السابقة يمكن إضافة 
مجموعة من آليات البحث إلى محركات بحث الصور لدعم اللغة العربيةء وتتمثل 
هذه الآليات فيما يلي :- 
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.٤‏ البحث بالتشكيل 

6. البحث الحر 

.٦‏ البحث بالترادف 

۷. البحث بالمتضادات 

۸. البحث بالمعاني 

9. البحث بالترجمة 

٠‏ . التعرف إلى الأخطاء العربية الشائعة 


VY‏ طرح سؤال للبحث : فائمة توفف عن الأحرف والأدوات 


وقد أوضح الملحق رقم 1 طبيعة النتائج التي يتم استرجاعها بآليات البحث 
العربية في محركات البحث. 


٤‏ خصائص محركات بحث الصور 
الببليوجرافي. ومستويات التكشيف. ولغات الوصف كما تم من اختبار محركات 
البحث الخاضعة لعينة الدراسة. 


٤‏ الوصف الببليوجرافي للصورة 

تتساوى محركات البحث العامة والمتعددة على الويب مع محركات البحث 
المحددة نوعيًا أو موضوعيًا في الاحتياج إلى شكل مقنن من أشكال ومعابير الوصف 
الببليوجرافي. وتحتاج محركات بحث الصور بطبيعة الوسيط إلى العناصر المادية 
او الشكلية لاستخدامها في استرجاع الصور المتكاملة مع العناصر الموضوعية 
المتمثلة في الكلمات الكشفية. ولا تحتوي محركات بحث العينة السابقة جميعها على 
RE DU oa Coa‏ لوست eus‏ تلض ال راف العامة ارف ads‏ مكف 
آليات البحث المدروسة في محركات بحث الصور انتفاء البحث بحقول الوصف 
الببليوجرافي في جميع محركات بحث العينة. وتتميز فواعد بيانات الصور 
(محركات البحث المحددة)عن نظيرتها في محركات بحث الصور على الويب 
بتقديم تسجيلات ببليوجرافية في محاولة للتفلب على مشكلات استرجاع !254223( 


Vay 


وهو ما يحاول هذا الفصل إضافته إلى محركات بحث الصور في التعامل مع 
الملفات الرقمية للنصوص أو الصور واستخراج حقول الوصف. 

وبالاعتماد على الشكل المقترح للتسجيلة الببليوجرافية للصور الرقمية على 
الويب في الفصل السابق المتمثل في المعيار المقترح لوصف الصور الرقمية لدبلن 
كور يمكن قياس وفحص محركات بحث العينة ومن ثم التعرف إلى الأشكال 
البسيطة من الوصف الببليوجرافي لمجموعاتها من الصور الرقمية المتمثل في 
التسجيلة النهائية للصورة؛ وهو ما يعني به الباحث الشكل الكامل من الوصف 
الببليوجرافي لوسيط المعلومات الذي يعرضه نظام الاسترجاع إذا ما وقع اختيار 
المستفيد على هذا الوسيط. ويمثل الجدول رقم (1-4) جانب الوصف الببليوجرافي 
لمحركات بحث الويب :- 


الجدول رقم )£-£( 
يوضح حقول الوصف الببليوجرافي التابعة لتسجيلات الصور الرقمية 


محركات بحث الويب محركات بحث محددة 
uu eS BEPIERA‏ 
Free-foto | Corbis Visoo |Picsearch| Google Fast Ditto | Alta-Vista‏ 

Y Y x v x Y x v : olgil 

A A x x x x x x الفنان. المصور‎ 

| : (المؤلف)‎ 
x x x x | x x 5 
"A 34 : الموضوع‎ 
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تابع - الجدول رقم (4-4) 
يوضح حقول الوصف الببليوجرافي التابعة لتسجيلات الصور الرقمية 


محركات بحث الويب 


Google Fast Ditto eS 
x 


x x x x x x x x لغة ملف الصورة‎ 
v v x x x x x x ٠ ةرو.صأ١ تغطرة‎ 
: المكان‎ 
x و‎ x x x x x x حقوق نشر‎ 
: الصورة‎ 
الكثير من الجوانب العامة التي يمكن تبيانها‎ (E-E) يوضح الجدول رقم‎ 
فيما يلي:-‎ 


m‏ يعد محركا البحث Visoo, Ditto‏ من أفقر محركات بحث الصور لحقول الوصف 
اليبليوجرافي. وهذا يرجع كما لاحظ الباحث إلى عدم احتواء محركي البحث 
لتسجيلات ببليوجرافية عن مجموعاتها من الصور الرقمية؛ إنما ترتبط هذه 
المحركات بصفحة الويب التي تحوي الصورة المحددة. مما يعمل على الانتقال 
إلى صفحة ويب أخرى بعيدة عن نطاق محرك بحث pall‏ ويعمل محرك 
Visoo‏ على ربط اللقطات المعروضة من الصور الرقمية بحجم أكبر لعرض 
الصورة بدون اتباعها بأية بيانات وصف ببليوجرافية» على أنه يخصص أحد 
بيانات عرض النتائج المتمثل في مسار الصورة للربط مع صفحة الويب 
مصدر الصورة. والحقول التي دلت عليها العلامات في الجدول لهذين 
المحركين إنما تأتي في واجهة العرض وليس في تسجيلة ببليوجرافية 
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يقدم محركا البحث Picsearch .Google‏ إطارًا آخر مختلمفًا عن إطار عرض 
التسجيلة الببليوجرافية وهو الإطار الذي يضم صفحة الويب التي تحوي 
الصورة الرفمية الاأصلية. إلا ان محرك البحث Google‏ يعتمد كلية في التعريف 
بالصورة الرقمية على إطار صفحة الويب بدلا من استخدام الحقول 
الببليوجرافية. فكان من الطبيعي أن يحتوي محرك بحث الصور Google‏ على 
عنصرين أو حقلين من حقول الوصف فقط هما مسار ملف الصورة الرقمية. 
ومسار صفحة الويب مصدر الصورة. 

تستخدم بعض محركات بحث الصور البحث بحقول أو عناصر وصف 
ببليوجرافي. على الرغم من أنها لا تستخدم تلك العناصر في صياغة 
التسجيلة الببليوجرافية. ويمثل ذلك محرك البحث Google‏ حيث يعرض 
مجموعة من الحقول المتاحة للبحث مثل نوع ملف الصورة. واختيار حقل 
اللون» وحجم الصورة. 

يتصف محرك بحث الصور Corbis‏ بالغالبية من صفات محركات البحث 
الأخرى؛ إلا أن كفاية عناصر البحث وحقول التسجيلة الببليوجرافية قد عكست 
الدور الذي يؤديه العنصر البشري في تغيير كفاية البحث في محركات الصور 
الرقمية. من خلال تقديم خصائص لوصف المحتوى الموضوعي للصور تتوفف 
على البعد الثالث للصورة: وهو ما يعجز die‏ حتى الآن برامج الزاحف في 
محركات بحث الويب. 

يعد محرك البحث Freefoto‏ من أفقر محركات عينة الدراسة كاملة في 
الاعتماد على اختزان ملفات الصور الرقمية في بيئة الوصف الببليوجرافي على 
الرغم من كونه الأقرب إلى التعامل مع الضبط والتقنين لمجموعاته 
المحدودة. ويأتي محرك البحث Corbis‏ ليكون أفضل محركات العينة في 
الاعتماد على عناصر وصف الصور الرفمية. وعلى الرغم من عدم إظهار هذا 
الأمر في الشكل النهائي Corbisyguat‏ إلا أن خيارات البحث المتقدمة لم تكن 
تركز على آليات البحث التقليدية مثل المنطق البوليني أو البحث الحرء وإنما 
اعتمدت على البحث بحقول مثل التفطية والبنية والمصور والمحتوى... مما 
عكس للباحث الحقول التي يتم إدخالها عن كل صورة رفمية مكونة التسجيلة 
النهائية. ثم إخضاع كل هذه الحقول لعمليات البحث أمام المستخدم. 
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ونستنتج مما سبق أنه لم يستخدم أي من محركات البحث السابقة مفهوم 
التسجيلة الببليوجرافية في المعنى الكامل لها سوى المحاولة التجارية لدى «Corbis‏ 
غير أن التعامل مع حقول البحث قد حدث اجتهادا من محركات بحث الويب 
والمحددة لاستكمال عناصر البحث المتقدم بعيدًا عن كونها عناصر للبحث في 
حقول تسجيلة تم بناؤها مسبمًا. 


وتعكس دلالات النتائج السابقة تأخر محركات البحث في التعرض إلى نهج 
معياري أو مقنن تستخدمه محركات بحث الصور في التعامل مع أوعية المعلومات 
النصية أو أوعية المعلومات ذات الوسائط الأخرى. ولا يتوقف هذا الأمر عند وسيط 
معلومات الصورة فقط وإنما يتعدى إلى أوعية الفيديو والصوت والرسوم المتحركة. 
وتأتي أهمية التسجيلات الببليوجرافية من احتوائها على مجموعة كبيرة من مفاتيح 
الوصول إلى تسجيلات ووحدات الصور الرقمية الطبيعية. 


وجاءت محركات البحث Corbis, Fast, Altavista, Picsearch‏ على الترتيب Janis‏ 
محركات عينة الدراسة في التعامل مع مفهوم ومحتوى التسجيلة البيليوجرافية. 
حيث اعتمدت هذه المحركات على استخدام حقول ثابتةء ثم تفريغ بيانات ملفات 
الصور الرقمية داخلهاء او إظهارها daia‏ امام مستخدم الويب في مرحلة البحث 
كما فعل «Corbis‏ وقد وصل الأمر إلى استخدام محرك Fast‏ لشكل مدخل التسجيلة 
في البدء بعنوان الصورة ثم وصف العناصر الموضوعية في جملتين أو أكثر. وبالمثل 
كان محرك Altavista‏ ثم اعتماد محرك Picsearch‏ على استخدام polic‏ الوصف 
على الرغم من عرض الصورة الرفمية مع صفحة الويب في إطار واحد. وكل ذلك 
ذلك بالاعتماد على إدخال سياسات وصف وتكشيف مقننة لافتباس وتفريغ بيانات 
الصور الرفمية من صفحات الويب. ومن ثم تصبح محركات بحث الويب. على غير 
المتوقع. أكثر ALES‏ من محركات البحث المحددة في التعامل مع عناصر الوصف 
الببليوجرافي. 


٤‏ مستويات التكشيف 


لقد آثر الباحث في هذه الخاصية الجمع بين نوعي محركات البحث» وذلك 
للاعتماد كلية على تحليل المصادر النظرية التي تصف عملية التكشيف داخل 


Yes بشت‎ 


محركات البحث دون الاعتماد على المشاهدة أو الملاحظة كباقي الخصائص 
السابقة. 


وتختلف وسائط معلومات الصور الرقمية عن الوسائط النصية التقليدية 
والرقمية من حيث عمليات التحليل الموضوعي. ويؤثر وسط حمل المعلومات في 
الصور الرفمية والمبني على الرؤية في عمليات التحليل الموضوعي المتمثلة في 
عمليات التكشيف للصور على مستوى التحليل الموضوعي للصور الرقمية. وإن ما 
سبق من اختلاف وسط حمل المعلومات في الصورة dic‏ في النص يعكس مستويات 
مختلفة من المعلومات يمكن للصورة أن تحملهاء وتتجلى هذه المستويات abel‏ 
المستفيدين بالنظر إلى وسيط الصورة. وتؤثر أيضًا اختلافات الرؤى إلى اختلاف 
المحتوى الموضوعي وتختلف على أثره الكلمات المفتاحية والواصفات. وتتمثل 
المستويات المختلفة للمعلومات داخل الصور إلى ثلاثة مستويات؛ الأول ويتعلق 
بمجموعة العناصر الأساسية التي تراها Quel‏ المستفيدين أول ما تقع على الصورة. 
أما الثاني فهو مجموعة العناصر التي تمثل الخلفية لمجموعة polial‏ السايقة: وأما 
المستوى الثالث فهو مجموعة المعاني والمفاهيم أو الأفكار أو المعاني التي لا تمثلها 
عناصر مادية تراها العين في الصورة. وهو ما يطلق عليه البعد الثالث في رؤية 
أوعية المعلومات المرئية. 

ويمكن التعامل مع المستويات الثلاثة السابقة في تكشيف الصور الرقمية إذا 
ما أخذت محركات البحث على عاتقها استخدام العنصر الإنساني والبشري في 
التعرف إلى المعاني والمفاهيم داخل الصورة. ويمكن أن يتأتى ذلك من خلال أحد 
العاملين وهما؛ أولا الاعتماد على التكشيف الآلي للصور الرقمية داخل قاعدة بيانات 
محرك البحث مع إمكانية إدخال التعديلات النهائية بشريًاء ثانيا يمكن لمحركات 
البحث أن تطرح مجموعاتها المضافة حديثا بواسطة برنامج الإضافة الزاحف أو 
العنكبوت أمام مستخدمي الصور على الويب لاقتراح المصطلحات التي تلائم هذه 
الصور في صورة تفاعل بين محرك الصور ومستخدمي مجموعات gual!‏ 
وبالاعتماد على المصطلحات الأكثر تواترًا وتكرارًا لكل صورة من الصور الرقمية 
يتم الوصول إلى الكلمات المفتاحية المعبرة عن الأبعاد الثلاثة لتكشيف الصورة. 

إن محركات البحث جميعها تعمل الآن على إجراء عمليات التكشيف معتمدة 
على النص المصاحب للصور الرقمية خاصة لتواجدها دائما كجزء مكون لصفحة 


NET حتلم‎ 


الويب التامة. وقد اتخذت محركات بحث الصور التكشيف الكامل لكل كلمات متن 
صفحات الويب مضمازرًا للتسابق؛ وأشار Sullivan, Danny‏ إلى أن هذا Giles‏ عمليات 
لتكشيف الصور التي تعتمد على حقول ورموز اللغة المعيارية لصفحات الويب HTML‏ 
meta tags‏ إلى جانب الاعتماد على jas‏ الكلمات المفتاحية HTML Kew Word‏ ( 
وتعتمد بعض محركات بحث الصور الأخرى على الكلمات ols‏ المواقع المهمة 
لعرض الصفحة المصدرية مثل GLAS‏ العنوان Title‏ وكلمات مسار الصفحة اهلاء 
إلى جانب الكلمات المحيطة بإطار الصورة والواصفة لمحتواها. وقد دفع الاعتماد 
على كلمات النص والحقول المختلفة لملفات الصور باللفة المعيارية في تكشيف 
الصور الرقمية دفع بعض محللي صفحات الويب إلى تطوير شكل النص وحقول 
اللغة المعيارية للعمل بكفاية أكثر على تقديم الكلمات المفتاحية المعبرة عن 


المحتوى؛ وقد طرحت Larisa Thomason‏ عناصر تطوير ملفات الصور وصفحاتها 
(v),‏ 


.١‏ الكلمات الواصفة في العنوان «Descriptive image file names‏ حيث Jein‏ العنوان 
كل الكلمات المعبرة عن عناصر الصور أو الموضوع الرئيس للصورة» بدلا من 
الكلمات غير المعبرة عن الموضوع. 

Y‏ الاهتمام بحقول الكلمات المفتاحية وحقول الوصف ALT text descriptions‏ حيث 
يضع مصمم الصفحة المصدرية وملف الصورة الرقمية كل الكلمات التي 
تصف محتوى الصورة وبأبعاده ASSEN‏ والعمل على تركيز الكلمات المعيرة 
فقط. 

". الاهتمام بالكلمات المحيطة بالصورة الرقمية surrounding content‏ حيث توضع 
الصور في مجموعة من الكلمات أو السطور الواصفة لمحتوى الصورة ويقترح 
الباحث أن تخصص مثل هذه السطور والجمل إلى التحليل الموضوعي 
باستخدام النص الشارح والذي سبق الحديث عنه في أشكال لغات تكشيف 
الصور الرقمية. 


Sullivan, Danny. Death Of A Meta Tag, Jupiter media Corporation, 2002, visited 25/ (1) 
12/1/2002, http://searchenginewatch.com/subscribers/articles/02/10-meta.html 
Thomason, Larisa. Promotion Tip: Search Engines Get The Picture, 2002, visited 25/ (v) 
12/2002, http://www.netmechanic.com/news/volS/promo, no3.htm 
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وتتبنى محركات البحث اتجاه التعامل مع الصورة من خلال النص 
المصاحب للصورة. وهو ما يجعل التأكيد على تحليل الصورة ومستويات تكشيفها 
[jul‏ ضروريًا. وعلى الجانب الآخر. فإن ثمة تقنية أخرى لتحليل الصورة تحاول 
الدخول إلى عمل محركات بحث الصور وهي تحليل المحتوى بعناصر اللون والشكل 
والبنية فيما يطلق عليه الاسترجاع المبني على المحتوى. 


يدت هذا o peel)‏ من الدزاسنة yay yell‏ إلى oa yall‏ ال ctas dl‏ 
لدى محركات بحث العينة السابقة لمحركات بحث الصورء ويوضح الجدول رقم 
(4:-0) مصادر محركات بحث الصور التي تمدها بالكلمات الواصفة ومداخل 
الاسترجاع في مرحلة trey!‏ ويعتمد الباحث في تحليل الجدول رقم (0-4) على 
الدراسات والمقالات التي تناولت التكشيف داخل محركات بحث العينة. وهذا يرجع 
ااا مجركات pita‏ فى اا اة ا فن ا بالتطلة 
إلى خصائص الكلمات المفتاحية المصاحبة للصورة إذا ما تم استرجاع تلك 
الصور. ويتم في هذا الشان الاعتماد على ثلاثة مجموعات من الكلمات المفتاحية 
تمثل المستويات MEN‏ لتكشيف الصور. 


الجدول رقم )0-1( يوضح مصادر تكشيف الصور داخل محركات البحث 


محركات بحث 
محركات بحث الويب ; 
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ويتضح من الجدول رقم (07t)‏ مصادر الحصول على الكلمات الكشفية 
للتعبير عن محتوى الصور داخل قاعدة بيانات محرك TOP‏ وقد ظهر جليًا من 


EM ME 


الجدول الاطراد في تعامل محركات البحث مع الصور fie‏ النصوص في معالجتهاء 
حيث تعاملت المحركات السابقة مع تكشيف المتن الكامل للصفحة المصدرية Host‏ 
Page‏ لإطار الصورة. وقد شذ عن ذلك محرك البحث (Corbis‏ حيث يتعامل هذا 
المحرك مع تسجيلات غير كاملة للصور الرقمية تتكون من بعض حقول الوصف 
المادي والموضوعي» وذلك لما له من طبيعة تكوين فواعد البيانات وليس محركات 
البحث. حيث تعالج الصورة من قبل مجموعة من المكشفين القائمين على اختيار 
الكلمات المفتاحية الملائمة للتعبير عن المحتوى. وتستخدم محركات البحث في 
حالة الاعتماد على التكشيف الكامل لنص الصفحة كل عناصر بناء الصفحة مثل 
تكشيف العنوان وتكشيف حقول الكلمات المفتاحية والمسار. وقد اعتمد الباحث في 
الوصول إلى مصادر تكشيف محركات البحث لصفحات الويب إلى المقارنة التي 
عفقدها RICHARD EINER PETERSON‏ عن مجموعة من السمات المشتركة بين محركات 


acai) 


14 لفات الوصف المستخدمة في التكشيف 


تعتمد محركات بحث الصور في تكشيف مجموعاتها على المتن الأصلي 
لصفحة الويب أو تلك الرموز التي يضعها مصممو صفحات الويب داخل ما يعرف 
بال HTML meta tags‏ وعلى ذلك فإن مستويات الوصف للمحتوى الموضوعي للصورة 
تعتمد كلية على وصف الموضوع داخل صفحة الويب المكون من مجموعة متكاملة 
من الجمل والعبارات داخل صفحة الويب. ولا تتعامل محركات بحث الصور مع 
الصور الرقمية التي تصاحب الصفحات النصية: وإنما تتعامل مع كل صور الويب 
التي يمكن أن تمتد إليها قبضة برامج الزاحف والعنكبوت. ولا تخلو الويب من 
الصور المنفردة التي لا تصاحب جملا أو عبارات واصفة للموضوع. ويقترح الباحث 
التعامل مع الصور الرقمية من خلال ثلاث lal‏ وصف للتعبير عن محتوى الصورة 
المرئي وتحويله إلى وسط النص. وتتركز هذه اللغات أولا في المصطلحات المنفردة 
وتبنى على عرض محتويات الصورة هنا باختلاف مستويات التكشيف (العناصر 
الأساسية والخلفيات والبعد المعنوي) في واصفات أو مصطلحات منفردة. وتأتي 


PETERSON, RICHARD EINER. Eight Internet search engines compared, first Monday, (1) 
1997, visited at 21/6/2003, http://www.firstmonday.dk/issues/issue2 2/peterson/ 
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العبارات لغة تعبير ثانية تبنى على استخدام عبارات غير مرتبة أو مترابطة تعبر كل 
منها على أحد العناصر الموضوعية في الصورة الرقمية. على أن تشمل هذه 
العبارات عناصر المستويات الثلاثة لتكشيف الصورة الرقمية. أما لغة التعبير الثالثة 
فهي الجمل أو المترابطة أو النص الشارح : وهو ما تعتمد عليه محركات البحث 
الحالية في تكشيف الصورء وتتمثل الجمل المترابطة في النص المصاحب للصورة. 
وقد تعرض الفصل الثالث بالتفصيل لذلك في مناقشة مستويات تكشيف الصور 
الرقمية في إطار المعالجة الفنية للصور الرفمية. 


وتتضح مختلف لفات الوصف السابقة عند فيام محركات بحث الصور في 
أداء مهامها لاسترجاع الصور المحددة. ويتحدد الأسلوب المتبع لمحرك البحث في 
النظر إلى التسجيلة النهائية. وما يصاحبها من وصف للموضوع سواء باستخدام 
المصطلحات المنفردة أو استخدام العبارات أو جمل الوصف (النص الشارح). 
ويوضح الجدول رقم (1-4) الأساليب المتبعة في محركات بحث العينة للتعرف إلى 
محتويات الصور وتنظيمها. والتي تستخدمها على الجانب الآخر في إتاحتها للبحث 
واستدعاء الصور. حيث يمثل المصطلحات المنفردة كل من مسار الملف أو مسار 
صفحة الويب (مصدر الصورة). وعنوان الصورةء والكلمات المفتاحية. ورموز 
Meta Tags‏ ويمثل العبارات الجمل غير التامة لوصف الموضوع للتعرف إلى 
المحتوى. أما الجمل الشارحة (النص) فيمثلها في تنظيم واسترجاع الصور داخل 
قواعد البيانات تلك النسخ من الصفحات المصدرية للصور الرقمية. ويكون 
الجدول كما يلي:- 


ويهدف الباحث إلى إبراز لفات الوصف وليس لفات التكشيف المنطوية 
على اللغة المقيدة واللغة الطبيعية. وتعتبر لغات الوصف هذه الأقسام الأساسية 
للغة التكشيف الطبيعية التي تتناسب أكثر مع الصور الفنية أو العامة أو الطبيعية, 
بعكس ما يكون في الصور العلمية التي تتناسب أكثر مع اللغات المقيدة؛ نظرًا 
للتخصص الموضوعي الذي تنتمي إليه مجموعات الصور. ويناسب استخدام 
النص الشارح التعامل مع الصور وتحويل المحتوى من الوسط المرئي إلى وسط 
النص؛ نظرًا لما يعتري الصور من تعدد عارم في الموضوعات سواء التي تدل 
عليها polie‏ الصورة ذاتها. أو تلك التي Jus‏ عليها الصورة بصفة Aale‏ نظرًا 
لطبيعة الفترة الزمنية التي تنتمي إليها أو طبيعة البيئة الجغرافية والمكان الذي 


— همه — 


الجدول رقم (5-4) 
يوضح لغات التعبير عن المحتوى الموضوعي للصور لمحركات البحث 


محركات بحث 
53.154 
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تنتمي إليه. حيث إن المصطلحات المنفردة والعبارات في اعتمادها على مبدأ 
الإحاطة والشمول تحتاج إلى أعداد كبيرة من وحدات الوصف وقد لا يتمكن 
المكشف من التعبير عن ذلك. إن استخدام لغات الوصف في التعبير يهتم اكثر ما 
يهتم بقواعد بيانات الصور ذات البناء البشري اليدوي ثم الاسترجاع الآلي؛ حيث 
تعتمد محركات البحث على متن الصفحة أو حقول بناء ملف لغة الترميز المعيارية. 
وإذا ما كان الأمر كذلك في محركات البحث وقواعد البيانات» فإن الباحث يقترح 
إدخال حقل آخر داخل ملفات الويب يتسع للجمل أو النص الشارح لمحتوى الصور 
الرقمية. ويمكن على الجانب الآخر استخدام حقل Key Words‏ في بداية الملف 
لوصف محتوى الصور. ويأتي كل ما سبق من طبيعة محركات البحث في التكشيف 
Lo‏ هو قائم وليس بإضافة كلمات أو جمل يختص بها محرك البحث لمجموعاته من 
الصور الرقمية. 


ويتضح من الجدول رقم (1-4) الحالات المختلفة التي توضع لوصف 
الموضوع داخل محركات بحث الصور. ويعتبر محرك البحث Picsearch‏ افضل 
المحركات في اعتماده على عناصر مختلفة بين عنوان ومسار الصورة والمتن 
الأصلي للصفحة المصدريةء وهو ما يعطي إمكانية التعرف إلى مختلف الموضوعات 
التي تشملها الصورة سواء في مرحلة التكشيف أو في مرحلة البحث والاستدعاء. 
على الجانب الآخر فإن محرك البحث Altavista‏ أقل محركات البحث $3405 لمصادر 
التكشيف والتعرف إلى محتويات الصورة في عرض الصور؛ إلا أن واقع عمل 
محركات بحث الصور جميعًا يعتمد على نصوص الصفحات المصدرية؛ ولا يعتبر 
ذلك سمة خاصة لمحرك Altavista‏ وإئما سمة مختلف محركات البحث التي تقتصر 
في عرض تسجيلاتها على أقل العناصر بتركيزها على نص الصفحات المصدرية؛ 
وهو ما دلت عليه نتائج البحث عن صور تتعلق بمصطلح Rose‏ ؛ حيث تعدت النتائج 
المستدعاة عشرات الآلاف من الصور الرقمية من مجموعات محركات البحث مما 
يدل papel Coe‏ التي عل الشمول والإحاطة في التكشيف. 


14 واجهات محركات بحث الصور 

تمثل واجهات محركات البحث بصفة dale‏ ومحركات بحث الصور بصفة 
خاصة. السبيل الأول للمستخدم للتعرف إلى نظام الاسترجاع داخل محركات 
البحث. وتتمثل أهمية الواجهات باعتبارها آداة Cay ped‏ لمحتويات محرك البحث. كما 
أنها مؤشر على البساطة أو التعقيد في التعامل مع عملية الاسترجاع في محركات 
البحث. وتزداد هذه الأهمية في محركات بحث الصور وهي التي تتعامل مع 
الوسائط المرئية (الصور). وما يغلب على واجهات محركات بحث الصور أنها 
تخدم البحث والاسترجاع في فاعدة بيانات صور المحرك؛ باحتوائها على مجموعة 
من أفضل الصور داخل قاعدة البيانات. كما تحتوي أيضًا على مجموعة من 
المصطلحات التي تكون في غالب الأمر الأقسام العامة لموضوعات الصور العامةءأو 
مجموعة من الأقسام العامة التي تندرج أسفلها مجموعات أكثر تخصصًا من 
المصطلحات لخدمة الاسترجاع بتلك المصطلحات وهي ما يتضمنه اسلوب التصفح 
في محركات بحث الصور. ويشمل الحديث التالي عن واجهات محركات البحث في 
تحليل تلك الصفحات والواجهات التي تخدم البحث المتقدم للصور. ونقاط القوة 
والضعف التي يخلفها تصميم هذه الصفحات وأثرها على استرجاع الصور. 
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وتختلف واجهات البحث بين محركات الصور وبعضها البعض» حيث يعتمد 
معظمها على وضع الصور ذات الموضوعات المهمة أو الجذابة للمستفيدين بشكل 
عام. وتبعًا لعينة البحث السابقة. فإن هذه العينة اختلفت في التعامل مع هذا 
الجانب؛ فمنها من ضم الواجهات الجذابة كثيرة الألوان ومنها ما اعتمد على 
الواجهات البسيطة المقتصرة على فراغ البحث وبعض المحددات الصعبة في 
تحديد النتائج المطلوبة. وتفلب طبيعة محرك البحث على واجهته في كل محركات 
البحث؛ فإن نظم استرجاع الصور التي تهدف إلى الربح تعمل على وضع شروط حق 
النشر إضافة إلى تحديد خدمات المحرك التي يمكن أن يقدمها إلى مستخدميه. 
ويوضح الجدول رقم (7-4) الجوانب التي يمكن أن توجد بها واجهات محرك 
البحث:- 


الجدول رقم (7-4) يوضح dine‏ البحث مع polic‏ واجهات البحث 


: كات‎ 
XAR E محركات بحث الويب‎ 
محددة‎ 
Free-foto Corbis | Visoo | Picsearch | Google) Fast Ditto |Alta-Vista 
ae 4 BN 4 i D v 3 عرض بعض الصور‎ 
34 تود‎ 34 "4 oY ad Y واجهات بسيطة يه‎ 
= 2 zx v v Y zz v تعدد واجهات البحث‎ 
T 1 
3 4 4 -- {v |- | -- xm شكل آليات | قوائم‎ 
Eu ل‎ i و‎ SE XN EE T | البحث‎ 
[x < Y inni | EE n v المساعدة لواجهة البحث‎ 
=- ivl - -5 Ln D P Er عناصر التفاعلية‎ 


ويشير الجدول رقم (A-E)‏ إلى مجموعة العناصر التي تكون واجهات 
محركات بحث الصور» وتختلف هذه العناصر Lene‏ بينها كعناصر مؤثرة في 


استرجاع الصور وتبسيط البحث. فقد تضمن العنصر الأول مجموعات الصور التي 
يمكن أن تضمها واجهة البحثء Gly‏ واقع بحث الصور داخل نظم استرجاعها يعكس 
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أن هذه الصور ليست ذات تأثير في استرجاع الصور. وباختبار عناصر الانتظام 
Jala‏ مجموعة الصورء. فإنها تهدف daas‏ إلى جذب انتباه المستفيد او لإضفاء شكل 
مميز لمحرك بحث الصور. إن مجموعات الصور التي يمكن أن تضمها واجهة 
البحث هي التي تخدم استرجاع الصور العلمية في حالة تقسيم الموضوعات العلمية 
إلى تفريعاتها المتخصصة. وقد حملت ثلاثة واجهات من عينة البحث صورا 
بداخلهاء وهي .Picsearch, Corbis, Ditto‏ وعلى ذلك Oe‏ تعدد الصور في واجهة البحث 
هو إحدى نقاط القوة في عرض التقسيم الموضوعي لمحرك البحث باستخدام 
الصور. أو تكون خلاف ذلك بعرض الصور لجذب الانتباه مما يكون له أثر سلبي 
في عرض واجهة محرك البحث. 

وتسبب مشكلة الانتقال من صفحة إلى أخرى داخل محركات البحث مشكلة 
قد لا يستطيع المستفيد الوصول إليها. فضلا عن الوقت المضاف إلى عملية 
البحث. وعلى هذا فإن شطر البحث داخل النظام إلى واجهة بحث بسيطة مع 
أخرى تحمل البحث المتقدم يمكن أن لا يفطن إليه الكثير من مستخدمي الويب. 
كما يكون له تاثير سلبي على الاستفادة بكل ما يقدمه محرك البحث من اليات 
بحث الصور. وفد اعتمدت أربعة محركات من العينة وهي Picsearch, Google, Corbis,‏ 
Fast‏ على أكثر من واجهة لبحث الصور تحمل الأولى آليات dale‏ ثم تحمل الأخرى 
الآليات الأكثر تقدمًا. إن احتواء واجهة بحث واحدة لمختلف آاليات البحث داخل 
قاعدة البيانات. يمكن المستفيد من التعرف إلى مختلف الآليات المستخدمة مما 
يترتب عليه التعامل مع مختلف هذه الآليات بحسب الحاجة الموضوعية لمستخدمي 


محرك بحث الصور. 


إن أهم ما يميز صفحات الويب هو كثرة الألوان والأشكال المرئية التي تملا 
صفحات الويب؛ إلا أن ذلك قد يبعد بالمستفيد عن التركيز الكامل في التعرف إلى 
وحدات وآليات البحث. وعلى ذلك فإن عرض واجهات البحث بشكل مبسط يجعل 
من السهل التعرف إلى محتويات الصفحة المختلفة من توجيهات وآليات البحثء إن 
البساطة التي يعنيها الباحث هي التنظيم في عرض الرسائل الموجهة للمستفيد 
والتي بطبيعة الأمر تساهم في تيسير عملية البحث. وهي ما يمكن أن توجد حتى 
في ظل الرسائل النصية الكثيرة في واجهة البحث. ويدخل في إطار التيسير الشكلي 
المتبع في بحث الصور ومحركات البحث بصفة خاصةء هو شكل aldi‏ البحث؛ فإن 
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بعضًا من محركات البحث تعتمد على القوائم المنسدلة والبعض الآخر يعتمد على 
تعيين آليات البحث المطلوبة بوضع الرموز المحددة لها. ويعد الشكل الثاني أقرب 
إلى تسهيل الرؤية واختيار آليات البحث. هذا فضلا عن ترك الكثير من المستفيدين 
لمعظم القوائم المنسدلة دون اكتشاف ما تحويه هذه القوائم. وقد اتبعت أربعة من 
محركات البحث القوائم في حين اتبع اثنان التحديد بالرموز مثل Fast, Picsearch‏ في 
حين اكتفت محركات Ditto (Jia‏ بواجهة البحث التي تحمل فراغ الكلمات المفتاحية 
daas‏ دون آليات أخرى, وهو ما يعكس غياب الدفة في بحث فاعدة بيانات محرك 
SENT‏ 


ويأتي الأمر الأخير في واجهات بحث الصور والمتعلق بتلميحات المساعدة 
التي توفر للمستفيد المعرفة التامة بقواعد البحث وأنواع آليات البحث المستخدمة 
داخل نظام استرجاع dines‏ وليس بالخفي أن السواد الأعظم من مستخدمي الويب 
لا يعرفون الأنواع المختلفة من آليات البحث داخل e‏ البحث. هذا فضلا عن 
استخدام أشكال مختلفة بين محركات البحث للتعبير عن أليات بحث واحدة 0 
استخدام (-. +) للتعبير عن معاملات المنطق البوليني (and, not)‏ « مما يكن له 
أكبر الأثر في ضياع كم من التحقيق أمام المستفيد. 

ويخلص الباحث من الحديث عن عناصر واجهات البحث إلى أن واجهات 
بحث الصور يجب أن تتميز بعناصر شكلية تساعد الباحث في إجراء عملية البحث 
مستخدمًا مختلف الإمكانات والآليات التي يوفرها نظام استرجاع الصور. ولا بد أن 
تتميز واجهة البحث بخلوها من الأعداد الكبيرة من الصور التي لا تهدف إلى 
عرض تقسيم موضوعي؛ إلا أن الأمر يختلف في نظم استرجاع الصور العلمية التي 
يمكن استخدام الصور ذاتها في عرض التخصصات الفرعية لموضوع نظام 
الاسترجاع العام. إلى جانب الاهتمام بوضع كل اليات بحث الصور في واجهة واحدة 
دون اللجوء إلى واجهات أكثر تقدما مما ييسر على المستفيد متابعة البحث. على أن 
تكون مختلف آليات البحث واضحة للمستفيد يختار منها باستخدام الترميز. 
ويعرض الجدول رقم (A-t)‏ تفصيلا لعناصر واجهة البحث وعدد المحركات التي 
تبنت تلك العناصرء حيث يتضمن في شقه الأول العناصر المكونة لواجهات محركات 
البحث» ويركز الشق VR:‏ على مدى أهمية كل عنصر منها على حدة. إلى جانب 
عدد المحركات التي تختص بكل عنصر من مجموع عدد محركات عينة الدراسة. 


ل 


الجدول رقم (A-E)‏ يوضح جوانب واجهات محركات بحث الصور 


عرض بعض الصور Y‏ غير مهم 
واجهات بسيطة à‏ مهم 
تعدد واجهات البحث £ NS‏ مهم 
شكل آليات البحث رموز وقوائم O AD‏ الرموز تعلو القوائم المنسدلة في الأهمية 
رموز Y‏ 
المساعدة داخل واجهة البحث Y‏ مهم 


14 طرق عرض النتائج ومكوناتها 

إن اختصاص محركات بحث الصور بالتعامل مع وسيط ذا خاصية محددة 
مثل الصورء يعمل على النظر إلى الجوانب المساعدة التي يوفرها محرك بحث الصور 
والتي تساعد المستفيدين في تحديد وتقييم النتائج المسترجعة من فاعدة بياناته 
الداخلية. وتتمثل هذه الجوانب في عاملين اثنين أولهما شكل عرض النتائع 
المسترجعة من وحدات الصور؛ وهو ما يكون في استدعاء الصورة منفردة أو في 
مجموعة من الحقول الواصفة أو في مجموعة من البيانات الشارحة أو في مجموعة من 
البيانات المحددة للاستخدام. أما ثانيهما فهو مكونات الوحدة المسترجعة في كل 
محرك حيث تدل البيانات والحقول المصاحبة على طبيعة وخدمات محرك البحث 
التي يتيحها للمستفيدين. ويمكن التعرف إلى كلا العاملين في العناصر التالية :- 
14 طرق عرض النتائج من الصور 

تعمل محركات بحث الصور على التميز فيما بينها في مختلف العناصر 
المساعدة على بحث الصور. والوصول إلى الدرجة المطلوية من كفاية 
الاسترجاع»سواء كان ذلك في البحث أو عرض الصورء. وشكل عرض النتائج هو 
أهم عناصر التباري بين محركات البحث. وتختلف أشكال عرض النتائج من لقطات 
منفردة أو لقطات مصاحبة لمجموعة من البيانات. وهي في محركات بحث العينة 
كما يلي:- 


س إ۷ 


Pyramids E m 
282x200 pixels € 13 KB 
More info 


الشكل رقم (\-t)‏ لقطات نتائج محركات البحث 


"d" شكل‎ 


http: //www.cruisecyprus.com/paradise cruises israel egypl.hlm 
File Size: 15 KB, 177 x 119 


p) 


URL: hüp://www.cruisocypruc.com/paradise cruises, ierael egypt htm 


Title: cruises to israel egypt holyland from cyprus 
Filename: 
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الجدول رقم (4-4) يوضح طرق عرض نتائج وحدات الصور الرقمية 


محركات بحث الويب 
Google Fast Ditto | Alta-Vista‏ 
صور منفردة em em v feel‏ 
ic ei‏ 
صور مع بيانات v v v v‏ 
عدد الصور فى 
Y. m ` In E‏ 
واجهة العرض 
J‏ 
تحديد عدد الصور 7 x‏ 5 ^ 


Picsearch 
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محركات بحث محددة 


Free-foto | Corbis 
-- v 
ال س ا‎ 
v ae 
E Yo 
5 "4 


ويتضح من الجدول رقم (A-E)‏ أن محركات البحث اعتمدت Vies‏ على 
خيار عرض اللقطات الممثلة للصورة الحقيقية في مصاحية مجموعة من البيانات 
كثيرة أو قليلة. ويرى الباحث أن خيار عرض لقطات الصور الرقمية يعد الشكل 
العتاسب والملاكم. للتعامل المركن.مع الضور: وقد جاء abated‏ على البيانات 
لمحركات العينة في أنها لا تعتمد في غالبيتها على تسجيلة ببليوجرافية يمكن 
الرجوع إليها للتعرف إلى مجموعة الحقول والعناصر الواصفة للصورء ومن ثم كان 
الاعتماد على البيانات. وقد استخدم محرك البحث Corbis‏ شكلا مختلفًا بالإضافة 
إلى الشكل رقم )١-4(‏ وهو عرض اللقطات مع رموز أو رسومات Icons‏ توضح 
الخيارات التي يمكن التعامل بها مع الصورة. كما يظهر في الشكل رقم )١-4(‏ 
c) des‏ 


وهذا الخيار الذي يقترحه الباحث في ظل وجود تسجيلة ببليوجرافيةء 
توضح كل أجزاء الصورة من موضوعات وشكل أمام المستفيد. وتكون اللقطات 
المفردة اكثر إيضاحًا إذا ما عرضت في غير وجود بيانات اخرى مما ييسر على 
المستفيدين استعراض النتائج. 


وعلى الجانب الآخر. فإن عدد اللقطات أو الوحدات في واجهة العرض 
الواحدة له تأثير على التدقيق الذي يقوم به المستفيد في الاطلاع على نتائج 
البحث. وتتسم اربعة محركات من عينة محركات البحث بعرض عدد كبير جدا من 
الوحدات يصل إلى ٠١‏ وحدة في واجهة البحث mo‏ وهي Picsearch, Altavista,‏ 
.Visoo, Google‏ يترتب على أعداد الوحدات الكبيرة فى العرض التشتت بين الصور 
وعدم الإجادة في الاطلاع. ويترتب على ذلك BON‏ صغر المقاسات NES‏ 
المرئية (اللقطات). وتتسم أربعة محركات أخرى هي Freefoto, Corbis Fast, Ditto‏ 
بصغر الأعداد المرئية في واجهة العرض الواحدة إلى ست وحدات في محرك Ditto‏ 
مما يعمل على التمكن الجيد الحكم على الوحدات المسترجعة. ويرتبط بهذا 
العنصر جانب آخر هو خيار تحديد الأعداد المسترجعة في كل واجهة عرض 
للنتائج وهو ما يمكن به للمستفيد التحكم في الوحدات المسترجعة إذا ما أراد 
التدقيق أو أراد التصفح السريع لكل النتائج. ويعطي محرك البحث Corbis‏ فقط هذه 
السمة في البحث دون مختلف المحركات الأخرى. 
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4 أنواع البيانات المصاحبة لعرض النتائج 
تختلف البيانات المصاحبة للصور المسترجهة في نتائج محركات بحث 
الصور بين بيانات الوصف المادي أو الموضوعي للصورة وبين تلك البيانات المتعلقة 
بطبيعة المحرك التجارية,أو العلمية. وخيارات التعامل مع كل وحدة من الصور 
المستدعاة. ويمثل الجدول رقم )٠١١-4(‏ أنواع البيانات التي تصاحب نتائج استرجاع 
الصور وشكل البيانات من ألفاظ أو رسومات := 
الجدول رقم )£-+1( يوضح البيانات والحقول المناسبة لعرض نتائج الصور 


محركات بحث 
محركات بحث الويب 


محددة 


Free-foto| Corbis | Visoo | Picsearch | Google | Fast Ditto |Alta-Vista 


Y ID -- -- Y v v عنوان الصورة | ا‎ 

حقول | ار السلف v x‏ -- و 55 = 
ar‏ 

Se se OB Dd E Pe ea 


ss =o 4 v Y 4 4 Y cal للصور | حجم‎ 


S aa "4 v v v 5 v مقاس الصورة‎ 


ويتبين من الجدول رقم )٠١-4(‏ أنواع البيانات والحقول التي تتبع عرض 
الصور في محركات بحث العينةء ونتج ان محركي بحث الصور Google, Ditto‏ قد 
حملا أكبر عدد من الحقول الواصفة للصورة الرقمية في عرض النتائج JSS‏ ويعمل 
محرك البحث Google‏ بذلك على إكمال النقص في الوصف الببليوجرافي وإغفال 
المحرك للتسجيلة الببليوجرافية كاملة؛حيث اعتمد على بديل آخر هو عرض 
الصفحة المصدرية كوصف كامل للموضوع والشكل. أما محرك البحث Ditto‏ فقد 
اعتمد على CAN‏ الميسظ للتسشيلة الببليوجرافيّة المصاحبة للنتائع بدلا cya‏ إقراد 
الصفحات النهائية لمجموعات الصور. وتعتبر الدراسة محركي البحث Altavista, Fast‏ 
من أهم محركات البحث التي اهتمت بعمل تسجيلة ببليوجرافية للصور الرقمية, 
وعلى الجانب الآخر فقد اهتمت هذه المحركات بعرض بعض البيانات عن الصورة 
في أثناء عرض النتائج ككل. وعلى الجانب الآخر فإن اختلاف محرك البحث 
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Corbis‏ في الاعتماد على وضع خيارات التعامل مع الصورة دون إيضاح أية عناصر 
لوصف الصورة الموضوعي أو المادي» يرجع إلى طبيعة المؤسسة القائمة على هذا 
المحرك وهي الطبيعة التجارية. وهو ما يتضح جليًا إذا ما تم النظر إلى الجدول 
الخاص بالتسجيلات النهائية لنجد الاهتمام بحقول النشر عن غيرها من الوصف 
الببليوجرافي للصور الرفمية. ويقترح الباحث تحويل البيانات إلى رموز تحدد كل ما 
يمكن التعامل به مع الصورة الرقمية. على أن يتم الرجوع إلى التسجيلة 
الببليوجرافية. ويفتقر محرك البحث Freefoto‏ إلى البيانات التي تتبع الصور» على 
أنه في الوقت ذاته لا يحمل في تسجيلته البيانات الببليوجرافية الواصفة بالقدر 
المناسب مما يعكس مدى ضعف الاهتمام بمجموعات الصور داخل هذا المحرك. 
ويعزى ذلك إلى صغر حجم المجموعات في قاعدة بيانات هذا المحرك كما اتضح 
من اعداد النتائج. 
14 سمات عرض الصور 

انضرد محرك Corbie tims‏ بمجموعة من السمات الخاصة لاسترجاع الصور 
مثل إمكانية حصر البحث في الصور الملونة فقط. أو الأبيض والأسود فقط. وكذلك 
إمكانية اختيار الصور ذات الشكل الأفقي أو cogent!‏ وأيضا تحديد الصور التي 
يظهر فيها أشخاص والتي لا يظهر فيها أشخاص. وكذلك زاوية الصورة مثل صورة 
مباشرة أو علوية أو من الفضاءء هذا بالإضافة إلى إمكانية استدعاء صور منفردة 
أو ملفات صور. كما في الجدول رقم )١١-4(‏ 


الجدول رقم )١١-4(‏ يوضح سمات عرض الصور 


محركات بحث الويب محركات بحث محددة 
Free-foto | Corbis Visoo |Picsearch| Google Fast Ditto | Alta-Vista‏ 
T t‏ 
تحديد لون الصورة 
(ملونة/ x "4 x x x x x x ET‏ 
وأسود) 
تحديد الشكل 
الهند d‏ للصورة x "4 x x x x x x‏ 
أفقي/ عمودي) 
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ونخلص مما سبق إلى أن شكل عرض الصور الرقمية في واجهة عرض 
النتائج يجب أن يكون خالصا من أي بيانات يمكن أن تعوق الاستطلاع للصور 
المسترجعة؛ إضافة إلى عرض أكبر قدر من مجموعات الصور على كل واجهة 
Gaye‏ كما أن خلفية عرض النتائج يجب أن تكون باللون الأبيض الذي يوضح 
العناصر الداخلة فيه. هذا إلى cole‏ إضافة رموز تحدد الخيارات الممكن 
إجراؤها تجاه الصورة المختارة؛ من تنزيل أو شراء أو إرسال أو رابط للصورة أو 
الرابط إلى التسجيلة النهائية لعرض الصورة بجانب كامل بيانات الوصف 
الموضوعي والمادي. 


5 خدمات محركات بحث الصور 


على بحث الصور ومن هذه الخدمات ما يلى:- 


٤‏ رسائل المتابعة أثناء البحث 


رسائل المتابعة هي إحدى أدوات نظم الاسترجاع في التفاعل مع 
المستفيدين. وتبرز أهمية رسائل المتابعة في وضع المستفيد دائما على الطريقة 
الصحيحة لتحقيق الاستفادة الكاملة من مصادر معلومات هذا النظام. وتتركز 
رسائل المتابعة في شكل تصحيح اليات بحث فاعدة البيانات من خلال التعليق على 
كلمات البحث المدخلة إلى النظام. ولا تقف مثل هذه الرسائل فقط عند الإفادة 
بخطأ الكلمات المستخدمة. وإنما تعمل على إعطاء الشكل المناسب للبحث داخل 
قاعدة البيانات. 


وقد اعتمدت بعض محركات بحث الصور على التفاعل مع المستفيد بواسطة 
رسائل المساعدة «Corbis fie‏ واعتمد متن الرسالة على عرض الآليات الصحيحة 
في البحث داخل هذه القاعدة. وعلى الجانب الآخر فإن محركات Google (fie‏ عملت 
على تنبية المستفيه يعدم صبلاحية كلمات البحث دون ali E‏ إلى الشكل الضحيع 
لبحث فاعدة الصور. ويقترح الباحث ان تكون رسائل المساعدة هي ذاتها نسخة من 
صفحة المساعدة التي يوفرها محرك البحث لمستخدمي قاعدة الصور. يتم فيها 
شرح آليات بحث الصور. 
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14 ترشيح الصور وفق سمات المستفيد 

تعتمد بعض نظم الاسترجاع الحديثة على إستراتيجية بحث يمكن من 
خلالها إشراك المستفيد في استرجاع قدر أكبر من وحدات التحقيق. وهي البحث 
اتتام play duum HANE‏ الفشتفية كعات ule cuoi‏ أن يكاز من PILL‏ 
المستدعاة اسم الموضوع أو رقم التصنيف المعبر عن الوجه الدقيق للموضوع. ومن 
ثم يمكن تضييق البحث من خلال إخراج مجموعة النتائج الأولية. غير أن هذه 
الإستراتيجية لا يتم العمل بها حرفيا في محركات بحث صور الويب, وقد اقترح 
محرك Freefoto‏ من ذلك بترشيح اكثر الصور صلة بموضوع البحث اثناء تصفح 
المستفيد لوحدات النتائج. 


14 مرشحات الصور (الفلاتر) 

تعد مرشحات الويب أو الفلاتر من أهم أدوات التعامل مع الشبكة العالمية 
التي تقد.مها محركات البحث. وتمنع مرشحات صور الويب المواد غير المناسبة 
للاسترجاع في بيئة محددة. وقد عملت مختلف محركات البحث على تقديم مثل 
هذه الخدمة في بحث كل من النص والصورة من خلال إعداد فائمة توقف عن 
مجموعة المصطلحات التي إذا ما تضمنها مصدر المعلومات لم يمر من مصفاة 
محرك البحث. ويقترح الباحث أن يتم الاعتماد على قائمة توقف تحدد اتجاهات 
برنامج الزاحف في التعرف إلى أوعية المعلومات النصية والمرئية غير المناسبة. 
وهو ما يعد بمثابة سياسة التزويد والإضافة التي ea‏ بها برنامج التزويد في 
محرك بحث الصور. وقد اهتمت محركات البح Alta- Vista, Corbis, Fast, Visoo‏ 
بالعمل على وضع آليات الترشيح للصور. للتعامل مع البيئات المختلفة لمستخدمي 
محركات بحث الصور الرقمية. 


وعلى الجانب الآخر فإن لمرشحات الصور الأثر الأكبر في بحث واسترجاع 
محركات الصور؛ حيث تمنع المرشحات الكثير من وحدات الصور الداخلة في 
الاستدعاء أو الواقعة ضمن التحقيق في حالة تلبية الحاجة الموضوعية للمستفيد. 
1 كثافة الصور 

تحتاج محركات بحث المعلومات المرئية على الويب إلى خصائص ترتبط 
UP pe‏ الشكل المادي لوسيط المعلومات.؛ ويرتبط 523922 الصور داخل محركات 
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البحث تقنية اختيار الصور ذات الكثافة العالية للنقاط داخل وحدة القياس الواحدة 
(البوصة)ء فكلما زادت كثافة النقط زادت جودة الصورة في العرض. ويطلق على 
هذا المفهوم مصطلح Resolution‏ وقد أضاف محرك البحث Fast‏ في تعريفه لهذه 
التقنية أن الصور الفوتوغرافية ذات الكثافة العالية من شأنها أن تأخذ حجما أكبر 
من الصور ذات الكثافة المنخفضة. كما أن عملية الطباعة لهذه الصور تتم بصورة 
أفضل من الصور منخفضة الكثافة. ويدخل في ذلك أيضًا حجم شاشة العرض أمام 
المستفيد؛ فتقل كثافة نقاط التوزيع بكبر حجم الشاشة والعكسء مما يؤثر على 
عرض الصور الرقمية!''. وأشارت دراسة حول الصور الرقمية مدى الاهتمام بهذه 
التقنية سواء للصور التي نتجت عن كاميرات رقمية أو تلك التي نتجت عن الإدخال 
بالماسح الضوئي. حيث تؤثر الكثافة المنخفضة للصور الرقمية على إظهار الصورة 
داخل شاشات العرض أو أوراق الطباعة على أنها فقط مجموعة من النقاط 
nfl Ael uad‏ تل لوحة غير lal Sates‏ )0 

ويتيح محرك بحث Corbis‏ إمكانية الاسترجاع بدرجات مختلفة من الكثافة 
تتدرج من ABLES‏ فوق عالية. وكثافة عالية. وكثافة متوسطة: ABUS,‏ ضعيفة. ولم 
يذكر خيار BEII‏ بين عناصر بحث أي من محركات بحث الصور liar‏ سوى ما 
ذكره CORBIS‏ في إرشادات البحث الخاصة به. 


14 حفظ Glew‏ البحث للمستفيد لمرات aala‏ 

من مجموعات الصور -Profile‏ ومن ثم يمكن التعامل مع إستراتيجيات بحث ثابتة 
يستدعي بها المستفيدون ما يحتاجون إليه من الصور الرفمية» دون تكرارها بعدد 
مرات البحث. 


وعلى الجانب الآخر. فإن محركات بحث الصور تعمل على jules‏ هذه 
السمات لدراسة خصائص الصور المطلوية إلى جانب الاحتياجات الموضوعية من 


Frequently Asked Questions - Picture Search. Fast Search & Transfer ASA, 2002, (*) 
visited 20/12/2002,: http://www.victoria.tc.ca/Resources/www.services.html 
Reichmann, Michael H. Understanding resolution, luminous landscape, (Y) 
2002, visited20/12/2002,: 
http://www.luminouslandscape.com/understanding_resolution.htm cite 
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الصور مما يفيد أيضًا في تقنين خدمات الإضافة والتزويد لبرنامج الزاحف. Jeng‏ 
محرك Fast‏ فقط على تقديم هذه الخدمة لباحثي مجموعات الصور داخل قاعدة 
محرك Alltheweb‏ 
4 كفاية استرجاع محركات بحث الصور 

إن الحديث عن معاملات قياس كفاية نظم وخدمات استرجاع المعلومات 
تأخذ أكثر من جانب يمكن تناولهء فقد تحدث لانكستر عن معاملات قياس كفاية 
خدمات المعلومات في مستويات ثلاثة؛ جاء في أولها الاعتماد على تقييم المستفيد 
لما يواجهه في التعامل مع نظام المعلومات وهو عن جوانب الزمن والتكلفة ثم 
العوامل النوعية في كفاية المحرك مثل جانب الاستدعاء وجانب التحقيق. واخيرًا 
مدت الفاكدة مق" Chega SILC bas acl‏ فلات السك دة 
لقياس كفاية خدمات المعلومات عند لانكستر Y‏ تتطابق مع تلك التي يمكن الاعتماد 
عليها في قياس كفاية محركات بحث gjall‏ ويمكن إجمال حجة الدراسة في 
العناصر التالية مختتمة الحديث بنموذج آخر يلاتم طا عمل S33‏ محركات 
بحث الصور. 


٤‏ محركات البحث المحددة 


لقد عمد الباحث إلى ذكر هذا النوع في بداية الدراسة على غير السابق 
من الخصائص؛ وذلك يرجع إلى التطابق البعيد بين نظام فياس الكفاية للانكستر 
والتعامل في محركات البحث المحددة التي تلائم مجموعات الملفات القريبة من 
الثيات في أعدادها. وتعتمد محركات بحث الصور وغيرها من قواعد بيانات 
خدمات المعلومات الأخرى على إحدى طرق التنظيم التي يبنى عليها شكل 
الاسترجاع مثل اعتماد الكلمات المفتاحية والاسترجاع باسلوب التصفح. وتختلف 
محركات البحث في طبيعة التنظيم لمحتوياتها عن قواعد البيانات عامة. حيث 
الاعتماد على التكشيف للنص الكامل واعتبار كل كلمات النص نقاط استرجاع 
لوحدة المعلومات. إلى جانب ذلك فإن وسيط الصورة يختلف في احتياجاته 
المعلوماتية عن تلك التي توجد للنصوص. وقد بدأ لانكستر بالحديث عن مقياسي 


)1( لانكسترء ولفرد. نظم استرجاع المعلومات / ترجمة حشمت قاسم_. القاهرة:دار غريب للطباعة والنشر 
والتوزيع. AAAY‏ ص VU‏ 
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الزمن والتكلفة Lamy‏ يعتبران وجهي عملة استخدام الإنترنت. حيث يترجم الوقت 
المبذول في البحث إلى تكلفة من ile‏ الباحث او تكلفة في الوقتء ولا تختلف هذه 
المقاييس بين جميع نظم وخدمات استرجاع المعلومات؛ إلا أن تقرير الكفاية يتوقف 
على الوحدات المسترجعة من جانب النظم لافادة الباحثين؛ فإذا be‏ كانت هذه 
الوحدات تلبي الجانب الأكبر من احتياجات المستفيد أصبحت التكلفة في مستوى 
منخفض إلى ile‏ الوقت المبذول لاسترجاع تلك الوحدات» وتسمى الوحدات 
المسترجعة المطابقة لاحتياجات المستفيد بالتحقيق؛ أحد أهم عوامل الحكم على 
كفاية الاسترجاع. وبالتعرض إلى تفسير نظام استرجاع لانكستر للمعلومات يتضح أن 
مفهوم الاستدعاء الذي يعتمد عليه المستفيد في تحديد كفاية النظام يختلف عما 
يوضحه الجدول رقم (YY7£)‏ لنظام معاملات الكفاية للانكستر؛ حيث ينظر 
المستفيد إلى أن الاستدعاء هو كل ما تم استرجاعه من داخل قاعدة البيانات 
ككل : أي كل المسترجع. على حين أن معامل الاستدعاء عند لانكستر يتم حسابه 
اعتمادًا على معرفة عدد الوحدات المسترجعة ذات الصلة بالموضوع (وهو ما لا 
يمكن إدراكه داخل محركات البحث سريعة التحديث). وعلى ذلك فإن الاستدعاء عند 
لانكستر هو فقط مجموعة من كل المسترجع؛ إلا أنه يساوي كل المسترجع عمليا عند 
المستفيد. ويوضح الجدول رقم (VY-£)‏ معاملات الكفاية عند لانكستر :- 


الجدول رقم )٠١-٤(‏ 


معاملات قياس الكفاية نموذج لانكستر يلائم لمحرك محدد“ 
أ + ج ب + د 
acr!‏ استدعاء تحقيق سوشره 
pee‏ مسترجع € s‏ 
ج + د فاقد استبعاد 


)*( المصدر السابق نفسة. 
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اعتمادًا على الجدول رقم (4-؟١)‏ تكون معاملات قياس الكفاية كما يلي :- 


معامل الاستدعاء = الوحدات المسترجعة الصالحة / كل الصالح للموضوع= أ / ctl‏ 
معامل التحقيق = الوحدات المسترجعة الصالحة / كل المسترجع = أ/ أ+ ب 
معامل الشوشرة - الوحدات المسترجعة غير الصالحة / كل المسترجع - ب / أ+ ب 
معمل الفاقد = الوحدات غير المسترجعة الصالحة / كل الصالح = ج / ctl‏ 

معامل الاستبعاد= الوحدات غير المسترجعة غير الصالحة / كل غير المتصل- د/ج+د 


14 محركات بحث الويب 

إن اعتماد نوع محركات البحث المحددة على نظام لانكستر يختلف بدوره 
Lac‏ يمكن التعامل معه في محركات بحث الويب» وذلك إنما يرجع إلى الديناميكية 
التي تعمل بها محركات بحث الويب في إضافة آلاف المواقع يوميا إلى قواعدهاء 
فضلا عن اعتماد أساليب مختلفة في التنظيم والبحث لصفحات الويب وملفات 
الصور. إلى جانب البمد التام عن التدخل البشري في تنظيم وبحث محركات بحث 
الويب. ويجب ملاحظة وجود الاستدعاء في النوع السابق كجانب مكمل للفاقد 
لتكملة كل المتصل بالموضوع الذي لم يسترجع. على أن الناحية العملية تحتم 
إطلاق مصطلح الاستدعاء على كل الوحدات المسترجعة لكي تلائم التطبيق العملي 
لحكم المستفيدين. ويطرح الباحث النموذج التالي الممثل في الجدول رقم (Y-t)‏ 
للاستخدام في تحديد كفاية محركات بحث الويب للصور الرقمية خاصة والأنواع 
الأخرى من محركات البحث LS dale‏ يلي := 


الجدول رقم (F-E)‏ معاملات قياس الكفاية المقترحة لمحركات بحث الصور 


أدب تحقيق شوشرة 
غير مسترجع د 
د استبعاد 
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وتكون المعاملات كما يلي :- 

Lolas‏ الاستدعاء = كل المسترجع / كل ما يشمله النظام = أ + ب /أ+ ب + د 

معامل التحقيق = كل المسترجع الصالح / كل الاستدعاء (المسترجع) أ / أ + ب 

معامل الشوشرة = كل المسترجع غير الصالح/ كل الاستدعاء ( المسترجع) ب/أ جب 

معامل الاستبعاد -كل المستبعد / كل ما يشمله النظام = د / أ + ب + د 

تم بناء النظام السابق على أسس هي :- 

ع إن من يصنع التنظيم داخل محركات البحث هو برنامج allai)‏ المعلومات) 
ومن غير المؤكد معرفة عدد الوحدات التي تلبي موضوع المستفيد. 

8 إن استخدام مصطلح الفقد مع الاسترجاع في النظم الآلية لا يوافق بيئة 
الويب التي تعمل على تكشيف كل كلمات النص التي تصبح نقاط استرجاع 
للنصء ومن ثم فإن التحكم في استدعاء النصوص يرجع إلى المستفيد 
السحدد للموضوع. واستمادًا على عدم تحديد النظام لما يحويه من وحدات 
عن موضوع dine‏ فإن حساب الفقد أو الفاقد من الوحدات ليس له معنى. 

ع إن طبيعة النظم الآلية تبنى على استدعاء كل ما يطابق إستراتيجية البحث 
ومن ثم لا يعطي النظام من جانبه أي شوشرة: وإنما يحدد المستفيد تلك 
الشوشرة من وجهة نظر احتياجات خاصة له. حيث يسترجع النظام كل ما 
تستدعيه كلمات البحث من وحدات. 

8 إن حقيقة التعامل مع نظم المعلومات الآلية هي أن الاستدعاء هو كل 
المسترجع وأن التحقيق هو ما يطابق احتياج المستفيد من داخل الاستدعاء. 

ويتعامل النموذج السابق مع طبيعة محركات البحث على الويب التي تتعامل 
مع الموضوعات في صفحات الويب كما قام عليه مصممو هذه الصفحات. ينتج عن 
تكشيف محركات البحث للنص الكامل أن تكون مختلف كلمات النص مداخل 
وكلمات مفتاحية يتم الاسترجاع من خلالها. وحري بالذكر أن المحركات التي سيتم 
تطبيق النموذج السابق عليها هي محركات البحث للغة العربية التي تعمل بتقنيات 
متقدمة خلاف ما يوجد عليه الواقع الآني لمحركات البحث؛ كأن يتم استدعاء 
الأشكال المختلفة لكلمة مفتاحية واحدة تعكس كل الجوانب الموضوعية مثل 

(مكتبات) التي تسترجع كتب» يكتب» كتاب» مكتبة من خلال البحث aub‏ الاشتقاق. 


—YYY — 


الجانب الثالث والأخير في طرح النموذج السابق أن الصورة كوسيط معلومات يتم 
المعلومات النصية. 


o/t‏ الخلاصة 
عملت الدراسة في هذا الفصل على تناول الخصائص العامة و النوعية 
لمحركات بحث الصور الرقمية. للعمل على فياس جوانب القوة والضعف بين 
محركات الدراسة. والأساليب المتبعة في تنظيم وبحث ملفات الصور الرقمية داخل 
قواعد بياناتها.وقد قسمت الدراسة هذه الخصائص إلى عامة في التطبيق بين كل 
المحركات و بين نوعية يعتمدها فقط بعض المحركات؛ لتنظيم وبحث الصور 
الرقمية.إلى جانب فياس خدمات محركات الصور مثل البيانات التابعة لعرض 

لقطات الصور وتفنيات العمل مثل فياس كثافة الصور الرقمية. 


.9 
کړه 
.9 
d‏ 
.9 
کړه 


— YY — 


الفصل الخامس 
مرشحات الصور 


٠ / 0‏ التمهيد 
ه / ١‏ مفاهيم الترشيح 

Y / 0‏ ترشيح المعلومات المصورة 

Y / o‏ أنماط ترشيح المعلومات المصورة 

t / o‏ أنواع المرشحات داخل محركات البحث 

ه / ه ترشيح الصور الرقمية 

0 / 1 ترشيح الصور داخل محركات بحث الصور 

V / 0‏ مرشحات الصور داخل محركات البحث 

ه / A‏ العلاقة بين الترشيح ومعاملات نظم الاسترجاع 
ه/ 4 الخاتمة 


مرشحات الصور 


ه/ التمهيد 


ينطوي مصطلح الترشيح بذاته على الكثير من المفاهيم التي قد تقترب في 
أحيان وتبعد في أحيان كثيرة عن مجال تنظيم وبحث المعلومات الرقمية. كما أن 
مفهوم ترشيح المعلومات على الويب يتضمن بداخله الكثير من المفاهيم الأخرى 
التي يمثل كل منها اتجاهًا في تناول ترشيح المعلومات. وصولا إلى مفهوم ترشيح 
الصور الرقمية داخل محركات بحت الصور. ويعتبر ترشيح الصور الرقمية أحد 
الموضوعات duc pall‏ المهمة داخل عمل محركات بحث الصورء فإن ثمة موضوعات 
جانبية لا يمكن إهمالها في عمل محركات الصور مثل ؛ ABLES‏ الصور Aged‏ 
إدراج صور الإعلانات التجارية. إلى جانب الموضوع الحالي المتعلق بترشيح أو منع 
وحدات محددة من الصور الرقمية لا يتم إدراجها ضمن نتائج البحث. 


إن تناول ترشيح الصور الرقمية على الويب يأخذ الكثير من المسارات 
المحددة بطبيعة المستفيدين. فيمكن تناول ترشيح الصور من ناحية نظم استرجاع 
المعلومات على ضوء التحكم في عنصري الاستدعاء والتحقيق. أيضًا الترشيح من 
ناحية الملاءمة لبيئة الاستخدام في منع الصور المخالفة؛ إلى جانب التعامل مع 
الصورة كشعار أو إعلان تجاري تؤخذ تجاهها سبل لمنع إزعاج مستخدمي الويب. 
وهناك الكثير من الدراسات التي اهتمت بترشيح المعلومات ليس من ناحية المحتوى 
وإنما من ناحية القيمة الموضوعية؛ حيث تميزت الويب عن غيرها من مصادر 
المملومات باختلاط الف تاشن من الفسرمات: داخل الموضوع الوا V‏ 


Jacob, Palme. Information Filtering, Department of Computer and Systems (*) 
Sciences,Stockholm University/KTH, 1998, cited 10/8/2005, 
http://dsv.su.se/jpalme/select/information-filtering.pdf 


—NYYN — 


ويهتم هذا الفصل بالحديث عن مرشحات الصور لما لها من تأثير في 
تنظيم واسترجاع المعلومات المصورة داخل محركات بحث الصور. حيث يشمل 
الحديث آلية العمل لهذه eal pall‏ وتأثيرها على الإضافة والتنظيم داخل قواعد 


ه/ مفاهيم الترشيح 
٥‏ ترشيح المعلومات 

يرتبط مفهوم ترشيح المعلومات filtering‏ بمفهوم آخر ملازم له هو استرجاع 
المعلومات (information retrieval‏ ويمكن القول إن ترشيح المعلومات هو جزء تابع 
للتحكم في المعلومات المستدعاة أو المسترجعة. وقد ورد مفهوم ترشيح المعلومات 
بحسب السياق المعني بهدف الترشيح. ومن بين التعريفات تعريف Nicholas Belkin‏ 
إن ترشيح المعلومات يساعد المستفيدين على مراقبة وتنقية المعلومات؛ أي أنه 
بشكل أكثر Fass‏ يتعلق بالتحكم في طبيمة المملومات ومو وعاتها الواردة إلى 
ons a‏ هذا المفهوه إلى فة الج ف uf Log Gall‏ تقذ 
الغاية الأساسية لوضع مرشحات البحث. ويرى الباحث أنه يتعارض مع السياق الذي 
ورد فيه المفهوم ؛ حيث تحدث السياق عن علاقة الترشيح باسترجاع المعلومات 
ومحركات البحث» غير أن السياق لم يعن باختيار المفهوم المحدد. 

Lal‏ قاموس ale‏ المكتبات والمعلومات على الخط المباشر 00115: فقد 
عكس المفهوم الحقيقي لمصطلح الترشيح المستخدم على الويب» وهو استخدام 
برامج خاصة التصميم لمنع مستخدم الحاسب الآلي أو الشبكة أو النظام من عرض 
محتوى محدد سلفا من خلال غلق هذا المحتوى» والمرشح أو الفلتر يستخدم أساسا 
ق Ra‏ من هركن geal‏ عن الريب .1 does‏ الات 
تأكيد هذا المفهوم على الترشيح الأخلاقي للمعلومات التي تعد الوظيفة الأساسية 
لبناء برامج الترشيح. 


Belkin, Nicholas. Technical, Business, and Legal Dimensions of Protecting Children (1) 
from Pornography on the Internet, NATIONAL ACADEMY PRESS, 2002, 

cited 1/8/2005, http://books.nap.edu/html/protecting  children/na statement.html 
ODLIS: Online Dictionary for Library and Information Science, (Y) 
cited 15/8/2005 http://lu.com/odlis/odlis_f.cfm#filtering 
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٥٠‏ المرشحات أو برامج الترشيح 

يرتبط بمصطلح ترشيح المعلومات مصطلح آخر هو مرشح المعلومات أو 
الفلتر الذي يدعم تحقيق مستخدمي الشبكات أو الحاسبات الآلية. وقد وضع 00115 
LE dl‏ تعريفًا لمرشح المعلومات filter‏ هو a‏ برامج الحاسبات الآلية الذي يسمح 
لبيانات محددة مسبقًا بالمرور إلى المستفيد» فعلى سبيل المثال يسمح هذا 
البرنامج بمرور عدد محدد من رسائل البريد الإلكتروني الوافدة من مواقع سابقة 
التحديد".!'' ومن ثم فإن ترشيح المعلومات في المعنى العام له يعني البرنامج أو 
الإجراءات أو السياسات التي يضعها مصمم مواقع الويب أو مستخدم الحاسب 
JYI‏ للتعامل مع محتويات محددة Lalu‏ من المعلومات المسترجعة أمام 
المستفيد. 

وتعد المفاهيم السابقة ممثلة نسبيًا لواقع استخدام الويب خاصة في بيئات 
محددة مثل البيئات العربية الإسلامية التي تتعامل مع الويب. غير أن كل ذلك له 
تأثير على طبيعة استدعاء المعلومات والتحقيق. أما الكثير من المستفيدين الذين 
تختلف سماتهم them profiles‏ في الوصول إلى معلومات الويب. وخاصة وحدات 
المعلومات المصورة. 


Y/o‏ ترشيح المعلومات المصورة 
1/۲/0 ترشيح المعلومات على الويب 

أضحت الويب المصدر الشامل لمصادر المعلومات على اختلاف موضوعاتها 
وأشكالها؛ النصية والصوتية والمصورة. وعملت الكثير من محركات بحث الويب 
على ملاءمة البيئات المختلفة لمستخدمي الويب بتوفير أدوات الحماية من 
المعلومات غير المرغوب بعرضها. وزاد أهمية ذلك وجود المواد المصورة الرقمية 
التي تعتبر أكثر مصادر المعلومات الرقمية حاجة إلى الترشيح والتنقية. مما أدى 
شقين هما ؛ الأول تصميم معايير ومقاييس إجراءات الترشيح» الثاني تصميم برامج 


Ibid. (3) 
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ترشيح ذات واجهات بسيطة ليست رقابية؛ لتدعم المستخدم على تحديد المعلومات 
اليس ys‏ الع رد Pa‏ 

إن استخدام ترشيح الصور على الويب يعتمد على التحديد المسبق لمعايير 
استرجاع الصور داخل واجهة بحث المحرك. حيث ترسم كلمات الترشيح بالمرور أو 
التوقف stop/go‏ الإستراتيجية العامة لاستدعاء الصور داخل قواعد بيانات الصور, 
ومن ثم تصبح الكلمات الدالة للترشيح هي كلمات ثابتة دائما في بناء إستراتيجية 
بحث الصور الرقمية داخل محرك بحث بعينه لمستفيد ذات سمات محددة. ويبنى 
على ذلك اختلاف معايير التحقيق والاستدعاء داخل محركات البحث التي تضع 
معها قياس مدى الكفاية في التوقف أو المرور لبعض وحدات الصور الرقمية داخل 


الشكل رقم (ه- \( 
التفاعل بين how‏ المستفيد وبحث مصادر الويب في ترشيح المعلومات 


Marinilli, Mauro. A Case-Based Approach to Adaptive Information Filtering for the (1) 
WWW, Università di Roma Tre Via della Vasca Navale, 2002, cited 25/8/2005, 
http://wwwis.win.tue.nl/asum99/marinilli/marinilli.html 
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نتائج البحث. وقد مثل ذلك الحديث عن العلاقة بين صياغة نماذج ثابتة تعبر عن 
اتجاهات مستخدمي الويب في بحث صفحات الويب كما ضي النموذج التالى C)-‏ 
يبرز الشكل السابق تفاعل المستفيد مع أدوات بحث الويب في رسم ملامح 
بحث واسترجاع الصور الرقمية؛ وقد مثل محركات الصور في النموذج السابق 
محرك البحث AltaVista‏ يتم التفاعل بين المستفيد وواجهة بحث الصور على 
صياغة الكلمات الدالة على الموضوع مع الكلمات المفتاحية الدالة على الترشيح. ثم 
تهذيب وتحديد النتائج المستدعاة تبعًا للقياس الداخلي عند المستفيد في تحديد 
درجة التحقيق. كما يظهر الشكل رقم )1-0( أن الترشيح في الصور الرقمية داخل 
محركات البحث يتم أثناء بحث المستفيد لقاعدة بيانات الصور الرقميةء وهذا يدل 
على أن الترشيح gih‏ بحسب احتياجات كل مستفيد على حدة في استرجاع وحدات 
الصور الرقمية. يعكس ذلك عدم اتباع محركات البحث لسياسات الترشيح أثناء 
إضافة واقتناء وحدات الصور الرقمية باستخدام برنامج الزاحف. ويرى الباحث أن 
هذا يلائم daas‏ محركات البحث العالمية غير المرتبطة بثقاضة ما مثل البيئة 
العربية أو الإسلامية. فإذا ما تقيد محرك بحث الصور بسياسة ثابتة لاقتناء 
وحدات الصور كان ذلك بمثابة ترشيح للصور الرقمية دون الحاجة إلى بناء Sacla‏ 
لسمات المستفيدين „User Model‏ 
يعتمد النظام السابق للتعامل مع المستفيد على رسم Tage)‏ يحدد 
احتياجات المستفيد في بحث المعلومات المصورة. وهذا النموذج يبنى على محاور 
PU‏ 
أولا : المحتوى العام لعرض المعلومات الذي يلائم أو يختلف مع محتوى كلمات 
البحث لدى المستفيد المصاغ في كلمات البحث. 
LL‏ : مجموعة من كلمات البحث والترشيح حالية الاستخدام في بحث المستفيد. 
وهي بدورها تختلف حسب طبيعة كل مستفيد على حدة. 
o Vu‏ : مجموعة الأفكار أو الآراء المطروحة للبحث من جانب المستفيد. أو تلك 
المطروحة بشأن ترشيح المعلومات. 


Ibid. (1) 
Lbid. (v) 


رابقا : مجموعة من الكلمات المفتاحية للترشيح التي تصاغ بعناية من قبل 
المستفيدين» على أن يكون لك من هذا الكلمات وزن نسبي يعكس طبيعة 
النتائج المسترجعة. بما يسمح بعد ذلك برسم إستراتيجية الترشيح لدى 
هذا المستفيد. 


ويضيف الباحث محورًا آخر هو: 
خامسًا : حاجة النظام إلى التحليل الدقيق لمحتوى المصادر والصور الرقمية على 
الويب» والتعبير عنها بمصطلحات كشفية أكثر 445 في وصف محتوى 
الصورة. وذلك de‏ التفاعل بين محرك البحث ومستخدم وجهة 
البحث. 
ati Y/Y/o‏ ترشيح المعلومات المصورة 
من e Jo Laan‏ وما x‏ المستفيدون من الموضوعات المشار إليها بکلمات البحث. 
وعلى ذلك» فإن ثمة إجراءات تتم داخل محرك الصور laus‏ بانتقاء محرك البحث 
لوحدات الصور الرقمية باستخدام قوائم التوقف أو المرور في برامج الزاحف. ثم 
العمل على إظهار ملامح المحتوى الحقيقة داخل سياق الكلمات الكشفية عن الصور 
الرقمية المعالجة داخل برنامج المكشف على أن يتم تحديث سياسات التكشيف 
بحث مستخدمي الصور الرقمية. أيضًا فإنه يمكن الاعتماد على الكلمات المحددة 
وتتكامل العناصر التالية لوضع آلية ترشيح داخل محرك بحث الصور :- 
> نموذج تحليل محتوى المصادر والصور الرقمية ثم التعبير عنها بقيم داخل 
> نموذج الاعتماد على كلمات الترشيح المسجلة من قبل المستفيدين التي 
تضاهي الكلمات الدالة على محتوى مجموعة الصور داخل فادة بيانات 
المكشف. 
> نموذج استفسارات البحث المطابق للكلمات المفتاحية في محتوى الوثائق 
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(a) e ors‏ إلى daas os Eug defi aus:‏ اليه عمل 
الترشيح داخل محركات البحث. 
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Te ede dto trigger the second put of the filering process 
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الشكل رقم Au! (Y-0)‏ عمل الترشيح داخل محركات بحث الويب 


Thi pet of the content vector is 
wed nly if the categorein 
module sx ceeds gite thigh 
enough scare so that a second, 
moore words {tering step is 

needed. 0222754 the document 
rejected without cdcubtingthe 
other three matching ¢ ampanents. 


ee 
Cua 


يلاحظ الباحث في الشكل رقم (Y-0)‏ والنماذج السابقة مدى oles!‏ 
محركات بحث الويب إلى صياغة سياسات الترشيح Anail‏ وهو ما (Sas‏ اعتياره 
مركزًا على جانب واحد فقط من أنواع مصادر المعلومات على الويب. وتحتاج 
الصور الرقمية داخل محركات البحث إلى إضافة تحليل المحتوى بجانب تحليل 
النصوص. غير أن اعتماد محركات البحث على إضافة عناصر metadata‏ يكسب 
سياسات الترشيح داخلها قدرة أكبر على ترشيح المعلومات المصورة. 


ه/ أنماط ترشيح المعلومات المصورة 


لا تختلف آليات الترشيح باختلاف هدف الترشيح سواء الأخلاقي أو الأمني 
أو تبعًا لقيمة المعلومات. وإنما تختلف أيضًا تبعًا لطبيعة المعلومات التي يتم 
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ترشيحها داخل الويب. ومن ثم يمكن الحديث هنا عن آليات ثلاث مختلفة في 

ترشيح المعلومات على الويب» ولكل من هذه الآليات ما يلائمها من خدمات ويرامح 
, )0 

الترشيح على الويب. 


٥٠‏ الترشيح داخل مصادر المعلومات 

تتضمن الإنترنت الكثير من مصادر المعلومات التي تخالف ما يريده الآباء 
pal!‏ أمام أطفالهم. أو ما لا يريده اختصاصيو المعلومات داخل مراكز المعلومات 
المتصلة بالويب. هذا فضلا عن تقييم الباحثين لمجموعات المصادر المسترجعة 
داخل قواعد البيانات أو محركات البحث. وقد قدمت الويب برامج للتعامل مع هذا 
النمط من الترشيح منها :- 
Adblock Plus Y‏ 
PithHelmet Y‏ 
Privoxy Y‏ 
2 


AdSubtract 


وتستطيع هذه البرامج بناء جدار مانع أمام الأشكال المختلفة للمعلومات 
غير المرغوب بها. 


ه/ الترشيح داخل البريد الإلكتروني 
تستقبل الحاسبات الشخصية المتصلة بالويب الكثير من أشكال المعلومات 
الضارة في صورة رسائل البريد الإلكتروني. وتعمل بعض من برامج الترشيح التالية 
على وضع وصف ببليوجرافي لمجموعات الرسائل الإلكترونية مع انتقاء الرسائل 
المسموح لها بالمرور إلى المستفيد. Aging‏ :- 
Procmail VY‏ 
maildop Y‏ 


Tagged Message Delivery Agent (TMDA) v 


Gross, Ben. Information Filtering, 2005, cited 10/10/2005, (*) 
http://bengross.com/filter.html 
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6 الترشيح داخل محركات البحث 

توفر محركات البحث مجموعة من آليات البحث ومعاملاته لتمكين المستفيد 
من صياغة إستراتيجية البحث النهائية داخل مجموعات قاعدة البيانات. وتتكون 
إستراتيجية البحث النهائية من الكلمات الدالة عن موضوع البحث» واعتمادًا على ذلك 
فإن كلمات الترشيح للانتقاء selection‏ أو التوقف stop‏ تؤثر بشدة على طبيعة النتائج 
المسترجعة من محرك البحث. ويرى الباحث أن استخدام المستفيدين لإستراتيجية 
بحث محددة وكلمات بعينهاء إنما يعد في ذاته إستراتيجية لترشيح المعلومات 
المسترجعة من كامل مجموعات قاعدة البيانات. وعلى ذلك قان الكلمات الدالة على 
المحتوى يمكن مد استخدامها للتحول إلى كلمات دالة لترشيح المعلومات تلائم كل 
مستفيد على حدة» أو إستراتيجية ثابتة لترشيح المعلومات المضافة إلى قاعدة 
البيانات بصفة عامة. ويوضح الشكل رقم إشراك العنصر البشري لمراقبة وصياغة 
تدفق المعلومات إلى جانب الإسهام في رسم سياسات ترشيح المعلومات داخل محرك 
البحث. وهو ما أطلق عليه الترشيح المبني على قيمة المعلومات. التي يتم وزنها 
بالاعتماد على كلمات البحث والاستفسارات من جانب المستفيدين. 


الشكل رقم )0( يوضح الترشيح المبني على القيمة داخل محرك البحث 
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يوضح الشكل رقم (Y-0)‏ أن ترشيح المعلومات Jal‏ محركات بحث 
الويب يعتمد على طرح كلمات البحث لاسترجاع مصادر المعلومات المضافة 
بواسطة برنامج الزاحف. ويقوم مستودع المعلومات قاعدة المحرك بتلبية 
الحاجات الموضوعية للمستفيدين: ثم انتقاء وحفظ الكلمات البحثية داخل قعدة 
البيانات داخل فاعدة ملامح البحث .feature repository‏ وهذه الملامح عبارة عن 
تقييم المستفيدين لطبيعة المعلومات داخل صفحات الويب. على أن بقوم 
المشرفون على محرك البحث بتهذيب تلك الملامح لتحويلها إلى سياسات 
مخصصة أو dele‏ لبحث قاعدة بيانات المحرك. غير أنه يمكن استخدامها LAS‏ 
اينات eh‏ هه بيس دو االو إل كا e algal sae‏ وع pie‏ ها aux‏ 
تأخذ ملايين من صفحات الويب وزن أو درجة قيمة المعلومات داخل هذه 
الصفحات. وقد سعت الكثير من محركات البحث على رأسها Google‏ في دعم 
ترشيح المعلومات حسب فيمة المحتوى. 

اعتمد النظام السابق في ترشيح المعلومات على مضاهاة ملامح البحث 
لدى المستفيدين بملامح الوثائق التي يتعامل معها محرك البحث. وهو ما يعتمد 
بشكل أساس على المعرفة المسبقة بملامح البحث لدى مستخدمي محرك البحث. 
غير أن تحديث آلية الترشيح هذه يحتاج الرجوع مسبقًا إلى ملامح الباحثين 
لرصد التفيرات بها. وثمة آلية أخرى أكثر Welas‏ وسرعة تحديثء. تحاول 
محركات البحث الاعتماد عليها في ترشيح المعلومات. وهي فيام مرشح المعلومات 
بتجميع ملامح الوثائق المضافة إلى محرك البحث؛ حيث يرسم مرشح البحث 
سياسة ثابتة لإضافة المصادر دخل محرك البحث. ويمكن لمحركات البعث في 
البيئات العربية اعتماد سياسة ترشيح ثابتة توفر الترشيح لمجموعاتها من الصور 
قبل إدخالها من مجموعات فاعدة بياناتهاء بالإضافة إلى رصد ملامح البحث 
واختيار النتائج لدى المستفيدين التي يقوم على تهذيبها وتحويلها إلى محلل 
الوثائق عنصر اخر هو المُجمع igatherer‏ ومن خلال ذلك يحدث ترشيح 
المعلومات بمضاهاة Js‏ من ملامح المستفيدين وملامح مصادر المعلومات داخل 


Value Fltering at Stanford. [W.P.], 2002, cited 10/11/2005, (*) 
http:/,dbpubs.stanford.edu:8091/~testbed/doc2/ValueFiltering/valueFilter- 
AdBW.Itm 
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صرف الس ا كما توجد أيضًا الكثير من الأدوات المساعدة في تحليل 
الكلمات البحثية داخل مرشح محرك البحث Jie‏ ؛ المحلل المعجمي word-‏ 
breaker‏ المحلل الصرفي .stemmers‏ 

ويعد Share-Point Portal Server m pa‏ أفضل برامج الترشيح التي تستخدم 
هذه الآلية في ترشيح مصادر الويب داخل محركات البحث ؛ حيث يمكنها قراءة 
المعلومات الإضافية المختزنة داخل صفحات الويب metadata‏ وأيضا التعامل مع 
خادمات الويب وفواعد البيانات ذات المجموعات الكبيرة من مصادر الويب. ويوضح 
الشكل رقم (1-0) aul‏ التفاعل بين ملامح المستفيدين وملامح مصادر الويب 
داخل محرك البحث:- 


الشكل رقم (t-0)‏ 
لبناء التفاعل بين ملا مح البحث ومرشح ملا مح مصادر الويب 


يوضح الشكل رفم ( (£—o‏ البنية المكونة لمرشح معلومات محرك بحث 
الويب» ويوضح الشكل المكونات الأساسية التي يمكن تفصيلها فيما يلي:- i‏ 


Content Crawling and Search Overview. Microsoft Corporation, (*) 
2005, cited 10/9/2005, 
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/spssdk/html/ 
_content_indexing_and_search_overview.asp 

Lbid. (Y) 
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محرك البحث 


يعمل هذا العنصر على تحويل الاستفسارات البحثية من اللفة الطبيعية إلى لغة 
SQL‏ الخاصة بقاعدة البيانات. 


محرك الكشاف 
يعمل هذا العنصر على تحليل خصائص صفحات الويب المأخوذة من نص 
صفحات الويب, ثم تحويل بعضها إلى فاعدة بيانات محرك البحث. 


المجمع gatherer‏ 
يعمل على تنظيم وإدارة مصادر الويب المضافة لمحرك decent!‏ إلى جالب 
احتوائه على القواعد المحددة للمعلومات حديثة الإضافة. 


محلل الكلمات 
يعمل على تحليل الكلمات الواردة في a yi‏ ارات الب ثية ALS. IT ve HP‏ 


المحلل الصرفي Stemmers‏ 
يعمل على التحليل الصرفي للكلمات داخل الاستفسارات البحثية ونصوص 
الويب. 


مرشح المعلومات Filter Daemon‏ 
وهو أهم عناصر ترشيح المعلومات. حيث يقوم باستيراد صفحات الويب 
حديثة الإضافة من المجمع. ثم تحويلها إلى سيل من المعلومات المرشحة 
المفلترة وخصائص تلك المعلومات محولا إياها إلى المجمع مرة أخرى. 
ويعتمد هذا العنصر على بروتوكولات تحليل النصوص إلى جانب فواعد 

الترشيح بالتكشيف IFilters‏ 


بروتوكول الترشيح 

وهو عبارة عن مجموعة من البروتوكولات التي تجهز محتويات مصادر الويب 
للدخول إلى حيز الترشيح. وتلائم هذه البروتوكولات الأشكال المختلفة من 
مصادر المعلومات على الويب. 
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^( المرشحات الكشضية IFilters‏ 
تقوم هذه المرشحات بفتح محتويات المصادر النصية ثم تفتيت نصها إلى 
خصائص وكلمات الترشيح. 

4( مصادر المحتوى 
وهي مصادر الويب التي يتصفحها محرك البحث اعتمادًا على خصوصية 
iat‏ البحث في التعامل مع نوع بذاته من تلك المصادر. وتتحدد أنواع تلك 


المصادر بتحديد رابط الوصول إليها HURL‏ حيث يبنى على ذلك Lad‏ نوع 
البروتوكولات المستخدمة في ترشيح هذه المصادر. 


Share-Point Portal Server automation تسيير النترشيح داخل‎ ٥ 
-: يمكن تلخيص آلية عمل هذه المرشحات في شقين هما‎ 
Content Crawling (¢ 91-0]! ه/*/ إضافة وترشيح‎ 


وتعمل كل برامج Share-Point Portal Server‏ بالاعتماد على زحف وجمع 
مصادر الويب ثم تكوين فواعد بياناتها للمعلومات المكشفة indices‏ إلى cole‏ 
احتواء المجمع على القياسات والمحددات التي تمكنه من التعامل مع ترشيح 
مصادر الويب ويحتفظ هذا العنصر بإحصاءات العمل النهائية لمرشح المعلومات. 
وتبدأ رحلة الترشيح تحديدًا عندما تعطي بعض ملفات التلميح بتغير محتوى 
صفحات الويب» وهي ملفات تحتفظ بمعلومات عن محتوى الويب داخل محركات 
ومرشحات الويب مثل ملفات NTFS‏ وتمد هذه الملفات عنصر المُجمع برابط URL‏ 
لبداية عملية التحديث والإضافة. وتتحول المصادر المضافة إلى محرك البحث 
من cone!‏ إلى مرشح المعلومات لاستقرائها في ضوء مواصفات الترشيح 
الموجودة لدى بروتوكول الترشيح لكي تتم عملية الترشيح بأفضل أشكالها. ثم 
تخرج كلمات الترشيح وبيانات مصادر الويب metadata‏ بتفاعل كل من فواعد 
الترشيح النصي IFilters‏ ومرشح المعلومات Filter Daemon‏ ثم تحول كل هذه 
البيانات إلى قاعدة بيانات محرك البحث لتحليل الكلمات المرشحة والدالة في 
مصادر الويب تحليلا لغويا وصرفيا للتعامل مع الاستفسارات البحثية القادمة من 
واجهة بحث المحرك. 
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Search Query Execution إ(تنفين استفسارات البحث‎ 0 


يمرر محرك البحث استفسار المستفيد من واجهة البحث إلى المحلل اللغوي 
للتعامل مع كلمات التوفف والمرور في سؤال البحث. ثم تحول كلمات المرور إلى 
المحلل الصرفي لوضعها في الشكل المضاهي للكلمات الدالة داخل مصادر الويب ؛ 
ذلك كي تنتج عملية المطابقة والمقارنة بين الكلمات الدالة في الوثائق المفتاحية 
في الاستفسار. وبعد إتمام المضاهاة تدرج كل خصائص مصادر المعلومات 
المسترجعة للتأكد من موافقتها التامة لخصائص موضوع سؤال البحث. ثم تمر تلك 
المعلومات المسترجعة بوزن الأهمية في التحقيقء وينظم ثبت النتائج المستدعاة في 
شاشات عرض النتائج. ويحجب مرشح المعلومات وحدات المعلومات غير الملائمة 
لخصائص سؤال البحث. 


٥‏ أنواع المرشحات Jal‏ محركات البحث 

تختلف مرشحات البحث المستخدمة لمصادر معلومات الويب بحسب جانب 
الاهتمام بترشيح المعلومات. ويتجاذب محتوى الإنترنت أطراف عدة تيدأ بمصمم 
الصفحات أو منتج محتوى مواقع الويب. ومحركات البحث باعتباره وسيطا لإيصال 
المعلومات إلى المستفيدين» ثم المستفيد النهائي الباحث عن المعلومات الرقمية. 
وباختلاف حجة لكل طرف من الأطراف السابقة يأتي وضع مرشح المعلومات كما 
في الأنواع C) ca tat‏ 


Client-side filters مرشح معلومات العميل‎ \/t/o 
يثبت هذا النوع من المرشحات عند حاسب عميل البحث عن المعلومات‎ 
الرقمية. حيث يمكن ضبط خصائص هذا النوع بما يوافق طبيعة البحث عن‎ 
معلوماتية محددة. وتستخدم مرشحات العميل بجانب الحاسبات الشخصيةء‎ cila La 
بالإضافة إلى الهيئات العاملة في بحث المعلومات على الويب كالمكتبات ومراكز‎ 

المعلومات والشركات العاملة في الويب. 


FILTERING. National Academy of Sciences, 2003, cited 1/9/2005 (*) 
http://www.nap.edu/netsafekids/pro. fm. filter.html 
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Content-limited (or filtered) ISPs مرشح معلومات مزودي الإانترنت‎ Y/t/o 
يستخدم هذا النوع من المرشحات داخل مزودي خدمات الإنترنت لتحديد وصول‎ 
مستخدمي الويب إلى نقاط موضوعية محددة. وتحتاط بذلك هذه الخدمات من استخدام‎ 
المستفيدين مثل الأطفال لمواقع الويب غير الملائمة. فضلا عن قصر‎ cilia بعض‎ 
الاستخدام على بعض الخدمات التعليمية أو التسلية مثل مواقع المحادثات الكتابية أو‎ 
الصوتية أو نشرات الأخبار الرقمية. ويعمل هذا النوع بكفاية للتحكم في إيصال رسائل‎ 
البريد الإلكتروني المستقبلة من أفراد أو جهات محددة: بما لا يضر بالحاسبات‎ 
المستقبلة الرسائل البريد الإلكتروني. ويلجأ مزودو الإنترنت إلى التحكم في المحتوى‎ 
الرقمي بأشكال مختلفة ؛ كأن يحدد مزودو الإنترنت محتوى محددًا يصل إلى فئات‎ 
الأطفال والبالغين من مستخدمي الويب. أما الشكل الآخر فهو طرح مستويات وصول‎ 

إلى المحتوى تختلف بين الفئات العمرية المستخدمة لخدمات الإنترنت. 


6ه مرشح معلومات خادمات الويب Server-side filters‏ 

يحقق هذا النوع أعلى كفاية في التعامل مع المعايير والضوابط الدولية 
لاسترجاع المعلومات؛ كنظم المكتبات و النظم الدراسية. حيث يمكن لأعضاء 
المؤسسة الواحدة الوصول إلى المعلومات بحدود ثابتة على نطاق أعضاء المؤسسة. 
ويمكن صياغة حدود الترشيح هنا بواسطة المؤسسات الدولية ذاتها أو خادماتها 
على الإنترنت. 
٥‏ مرشح معلومات محركات البحث Search-engine filters‏ 

يستخدم هذا النوع داخل فواعد بيانات محركات بحث الويب. حيث يتيح 
محرك البحث إيقاف أو تشغيل مرشح المعلومات بحسب حاجة كل مستفيد على 
حدة. وتعمل هذه المرشحات عند تشغيلها إما على حجب النتائج غير المناسبة بين 
كل النتائج المسترجعة. ومنها «Google, AltaVista‏ أو على تحديد نطاق البحث ضمن 
مواقع أو صفحات تلائم نوعًا محددًا من المستفيدين ومنها .Yahoo, Lycos‏ 


0/0 ترشيح الصور الرقمية 


انحصرت أساليب استرجاع الصور الرقمية على الاسترجاع المبني على 
النص والاسترجاع المبني على المحتوى. ولعله يمكن القول إن هناك رابطًا ما بين 
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خصائص استدعاء وحدات الصور ضمن نتائج بحث محركات الصور وبين استدعاء 
مرشح الصور لمجموعة من هذه الوحدات ومن ثم حجبها عن العرض أمام 
المستفيدين. وبهذا المرتكز يمكن تفعيل آليات عمل مرشحات الصور في ترشيح 
المعلومات الرقمية المصورة. حيث يقارن مرشح الصور الرقمية بين الكلمات 
الواصفة للصورة وكلمات الترشيح لدى المستفيد. أما في الحالة الأخرى فإن مرشح 
الصور الرفمية يعمل على تحليل بنية الصورة الرقمية texture or content based‏ مع 
نماذج البحث الصورة لحجب الصور المرشحة. وفيما يلي أنماط التعامل مع الصور 
الرقمية :- 


\/o/o‏ الترشيح النصي 

يعمل الترشيح النصي آلية التكشيف نفسها المستخدمة داخل محركات بحث 
الويب. ويعتمد الترشيح النصي على إخضاع النص المحيط بملف الصورة 
لاستخراج الكلمات الدالة على محتوى الصورة الرقمية. ومن ثم ترشيح محتوى 
الصورة اعتمادًا على كلمات النص الدالة. فضلا عما يمكن أن تفيد به عنصر 
ميتاداتا في تخصيص عنصر محدد داخل حقول وصف الصورة» يضم هذا paidi‏ 
جميع الكلمات الدالة التي تحويها الصورة: ويمكن في هذه الحالة نسخ محتويات 
عنصر الكلمات المفتاحية meta keyword‏ أو تهيئة حمل الكلمات المفتاحية ذاته 
للتعامل مع مرشحات البحث. ويقترح الباحث هنا تصميم سياسة ثابتة بين عمل 
مرشح البحث وحقول ميتاداتا تمكن مرشح البحث من تحليل محتوى الصورة دون 
الاعتماد على النص الخارجي لصفحة الويب. 


وتستخدم مرشحات الصور أساليب ثلاثة مختلفة للوصول إلى الترشيح 
Q) ;‏ 
المبني على النص؛ وهي كمأ يلي :- 
0ه إبقاف الكلمات الدالة Keyword Blocking‏ 
يتخذ مرشح الصور هنا قائمة بمجموعة من الكلمات الدالة المحددة سلقًا 


التى إذا ما وجدت فى ملف أو صفحة الصورة الرقمية توقف محرك البحث عا 
Le‏ وجدت في و يه asg‏ محرك الب عن 


Davies, Roy. Vision and Signal Processing. London university, 2004, cited 10/10/ (1) 
2005, http://www.ph.rhbnc.ac.uk/research/sp/sp.html 
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ضمها إلى قاعدة بياناته. ومن e‏ يغلق محرك البحث وصول المستفيدين إلى 
صفحة أو موقع الويب من خلاله؛ إلا أن هذا الأسلوب يواجه مشكلة أساسية في 
اعتماده على الترشيح بالنص فقط. وهي أن الترشيح لا يلقي أهمية إلى سياق 
النص الذي وردت فيه الكلمات الدالة. فعلى سبيل المثال يمكن لكلمة مثل ( الجنس) 
أن تأتي في صفحة عن الأدوية أو الاستشارات الطبية لا تحمل أي صور pai‏ عنها 
#6 إيقاف المجموعات الموضوعيه Packet Filtering‏ 
الإنترنت JII IPaddresses‏ على طبيعة صفحاتها. وهذه الطريقة تعد algu‏ 
الاستخدام داخل مرشحات البحث؛ إلا أن تطور تقنيات عناوين الإنترنت قد تخدع 
هذه المرشحات في إعطاء صفحأتها عناوين وهمية IP-independent virtual hosts‏ 
«atlas‏ ااطبيمة PUES‏ لمحتوى موفع الويب. 
#0 إيقاف محدد المصادر URL Blocking‏ 

يتعامل مرشح البحث في هذه الحالة مع كل موفع/ صفحة ويب على (Bax‏ 
خلاف الأسلوب السابق. وتبنى آلية العمل هنا على تجهيز قائمة بكل مسارات 
صفحات الويب مغلقة الوصول URLS‏ ويستطيع المستفيد هنا تصفح محتويات 
المواقع خلاف المسارات التي يمتنع مرشح البحث عن عرضها لمخالفة محتوى هذا 
المسار. 

وعلى الرغم من تميز كل من الطرق السابقة في غلق المحتوى غير الشرعي 
أمام مستخدمي الويب. إلا أنها مازالت بحاجة أكبر للتطوير والتحديث» بل ويمكن 
القول أيضًا إن الويب بوصفه afu‏ عالمية مفتوحة لمختلف الموضوعات ومختلف 
اللفات يصعب السيطرة على محتواها من خلال استخدام مرشح بحث ذي لغة 
واحدة أو مرشح يحمل كلمات دالة عن موضوع واحد. 
٥‏ الترشيح التحليلي 

إن استخدام الكلمات الدالة في الترشيح النصي يؤدي دوره بكفاية داخل 
وسيط المعلومات النصي» غير أن ذلك لا يحقق المرجو dia‏ مع وسائط المعلومات 
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المرئية والمسموعة. وأخذ نمط الترشيح التحليلي الكثير من أشكال التعامل التقني 
الرقمي مع الصور على الويب. وقد عمل فريق أكاديمي من جامعة لندن على 
plana‏ قرامتات ممالتجة اللشارات الرهمية للتطبيق على GS uiu abes‏ 
الرقمية .signal processing for digital image‏ وتعتمد هذه الدراسات على تحليل محتوى 
الصور الرقمية Ley‏ يمكن ممه تحديد مختلف العتاصر المرقية القي يبنى غا 
محتوى الصورة.ومن ثم تستطيع مرشحات الصور المبنية على معالجة الإشارات 
المرئية تحويل ملامح الترشيح لدى المستفيدين إلى خصائص مرئية رقمية:؛ 
يستخدمها مرشح المعلومات في مضاهاة وحدات الصور الرقمية المسترجعة داخل 
وام ul joe gs‏ الس V.‏ 

وقد اهتمت معظم محركات بحث الصور الرقمية خاصة بالتعامل مع 
نرشحاث us‏ البالغين t‏ خيث يعذ هذا الجانب SST‏ جوائب الحاجة إلى استخدام 
Gladys‏ الصور على الويب. شك مرش جات الكور 143,31 be: Casali‏ 
المحتوى داخل هذا المجال على ثلاث مراحل يوضحها الشكل رقم )0-0( كما 

7 
Sgh 


3 Steps to Content-Based Image Filtering using eVe 


صورة 
رقمية 


صون حديثة الاضافة 


الشكل رقم )0-0( لمراحل الترشيح المبني على المحتوى للصور الرقمية 


Ibid. (*) 
using eve for Content Filtering. EVision, 2004, cited 5/10/2005, (Y) 
http://www.evisionglobal.com/business/eVe content filtering.pdf 
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Skin Tone Filter مرشح لون البشرة‎ Y/Y/o/o 
والهدف الأساس من هذه الخطوة معرفة المناطق الملونة ذات المساحات‎ 
من‎ 4S 5 الكبيرة على سطح الصورة الرقمية. حيث خصصت هذه المرشحات‎ 
الألوان الملائمة للتعرف إلى ألوان تشابه إلى حد كبير ألوان بشرة الإنسان. حيث‎ 
اعتمدت على اختيار اللون الأحمر مع مزيج من البني والأصفر القاتم للتعرف إلى‎ 
الأشكال المختلفة التي تتواجد عليها هذه الصور. وتبعًا لأن الألوان السابقة هي التي‎ 
تشغل المساحات الكبيرة من بنية الصورة. فإن مرشحات البحث تفصل تلك الصور‎ 
عن مجموعات الصور داخل فاعدة بيانات محرك البحث. ويمكن القول إن الألوان‎ 
المساحات الضيقة تشير إلى عدم ظهور البشرة بشكل كبير في‎ als المختلفة‎ 

الصورة l‏ 14408 ومن ثم لا يملع مرشح البحث إضافتها لمجموعات الصور. 

وتعتمد بعض الفلاتر في تحليل ألوان الصورة الرقمية على طريقتين ؛ أولا 
طريتة x43‏ اللون height‏ 33813 صورها طريقة 256 plas, Cua (colar‏ مرشح الصور 
Laa‏ ثابتة لكل لون ثم تحليل كل نقطة pixel‏ على الصورة وتحديد قيمتهاء ومن ثم 
حساب قيمة الصورة ككل. ثانيًا طريقة color based‏ فتتعامل مع الألوان بحسب 
مكوناتها الأصلية .red/green/blue‏ وهذه الطريقة تعتير أسرع في فراءة MN‏ الصورة 
وال OY) xs Dat Sade ae‏ 


Analyze تحليل الصورة‎ Y/Y/o/o 
تأخذ الصور المستبعدة من الإضافة إلى محرك البحث التوقيع الرقمي‎ 
الذي تعرف من خلاله ملاءمة أو مخالفة الصورة عن‎ Automatic segmentation 

سياسة الترشيح داخل محرك البحث. 
0ه المضاهاة والمقارنة comparison‏ 

بعد تحديد التوفيع الرقمي لمجموعات الصور. توضع الصورة الرقمية 
موضع المضاهاة بينها وبين مجموعات مرجعية سالفة الإضافة داخل فاعدة بيانات 
محرك البحث. وهذه المجموعات تحمل مجموعة من الخصائص يستطيع مرشح 


Image Filtering. No software patents, 2003, cited 1/10/2005, (*) 
http://www.nosoftwarepatents.com/ 
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الصور تحديد القرار النهائي باستبعاد أو إضافة الصور الرقمية موضع الترشيح. 
ويتم إجراء المضاهاة بان تستبعد تماما الصور التي تحصل على 77٠١‏ فأكثر لنسبة 
التشابه بينها وبين مجموعات الصور المرجهية. أما الصور ذات نسية 4N*-í*‏ 
فيتم إرجاؤها لتدخل العنصر البشري في قرار الاستبعاد أو الإبقاء. وتضاف إلى 
قاعدة بيانات محرك البحث مجموعة الصور التي حصلت في مضاهاتها على نسبة 
Jal‏ من Jit‏ 

وقد اتفقت هذه الأنواع داخل مرشحات البحث مع تحليل محتوى لأغراض 
gle aul‏ وتبني عناصر تحليل محتوى الصورة الرقمية عامة على ما يلي ME‏ 
أولا: الألوان الكونية Global Color‏ 

يعتمد تحليل المحتوى هنا على تحديد القيم الثابتة والمتغيرة للألوان داخل 
الصورة الرقمية اعتمادًا على تحليلها إلى الألوان الكونية الثلاثة الأحمر والأخضر 
GMs‏ ومن ثم ARG‏ الصورة كاملة قيمة واحدة. 
ثانيًا: الألوان المحلية Local Color‏ 

يعمل هذا العنصر على تحديد اللون الفالب داخل الصورة الرفمية. ثم 
إعادة تحليل هذا اللون اعتمادًا على قيمة واحدة بين YOU‏ قيمة لكل الألوان 
المستخدمة في تحليل الصور الرفمية. 
كالثا: شكل الصورة Shape‏ 

يستخدم هذا العنصر تقنيات تحليل الصورة إلى الأشكال الرقمية المكونة 
لمحتوى الصورة. واعتمادًا على ذلك تتضح خصائص كل شكل على حدة Ley‏ يمكن 
التحكم في جميع أشكال الصورة. 
رابعًا: بنية الصورة Texture‏ 

يتلخص هذا العنصر في تحليل اتجاهات بنية الصورة ودرجة التباين 
داخلها. i‏ 
Venters, Colin C. and Cooper, Matthew. A Review of Content-Based Image Retrieval )١(‏ 


Systems, University of Manchester, 2002, cited 1/10/2005, 
http://www.jtap.ac.uk/reports/htm/jtap-054.html 
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عملت أنواع المرشحات السابقة على ضبط نوع واحد من الموضوعات غير 
المشروعة على الويب. وقد اجتهدت مرشحات التحليل المرئي على تحليل بنية 
الصورة. غير أن الويب تتضمن من النصوص ما هو أخطر من الصور أيضا. وعلى 
ذلك يرى الباحث أن استخدام تقنية تحليل المحتوى المرئي للصور الرقمية 
بجانب تحليل النص يصنع مرشح بحث متكامل قادر على ضبط محتوى الويب 
المرئي متعدد اللفات والموضوعات. 


٥‏ ترشيح الصور داخل محركات بحث الصور 

تنتهج محركات بحث الصور منهجًا خاصًا في التعامل مع الصور الرقمية؛ 
إضافة وتنظيما RETEN‏ وهي تختلف بذلك عن التعامل مع الأشكال الأخرى من 
المعلومات الرقمية. وتأخذ مرشحات الصور بعض خصائص التكشيف والاسترجاع 
داخل محرك الصور. فيأخذ من المكشف مسح النصوص المصاحبة للصورة أو 
مسح عناصر ميتاداتا ذاتها داخل ملف الصورة الرقمية. ومن ثم يمكنها التعرف 
إلى الكلمات الدالة على الموضوع ثم مضاهاتها La‏ لديها من قوائم كلمات التوقف. 
هذا فضلا عن إمكانية تزويد مرشحات الصور بالتقنيات اللازمة لتحليل بنية وألوان 
الصور الرقمية لاستخدامها في ترشيح الصور. وتكون بذلك الألوان في الترشيح 
التحليلي مرادفة لاستخدام الكلمات في الترشيح النصي. 


ويهتم هذا الجزء من الدراسة بالحديث عن خصائص عمل مرشحات 
الصور داخل محركات الصور وتحديدها لإمكانية دراسة واقعها الفعلي داخل 
محركات البحث في الجزء التالي من الدراسة. ويعتمد الباحث في تحديد 
خصائص مرشحات الصور على النموذج الوارد في الشكل رقم (1) :-)( 

يركز شكل رقم ( 170( لترشيح الصور الرقمية داخل محركات البحث على 
استخدام الترشيح النصي» ويتضح ذلك جليًا من تحليل الميتاداتا وتعليقات 
المستفيدين وتسجيل ملامح مستخدمي الصور الرقمية داخل محرك البحث. وقد 
استخلص الباحث الخصائص التالية التي يعتمد عليها مرشح الصور:- 


Value Filtering at Stanford. Optc. O) 
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بيانات 
الترشيح 


تسجيلات 
الحو طت 


الشكل رقم )1-0( بنية ترشيح الصور داخل محركات البحث 


ASI aad daa الصور‎ liia 31 ور‎ dus agen تيل‎ Nail 
لاقتباس الكلمات الدالة داخل محتوى الصورة الرقمية حالية الإضافة لقاعدة‎ 
البيانات.‎ 

إمكانية تحليل روابط i‏ صفحات الويب حال اعتماد مرشح البح على 
الترشيح باستخدام -URL blocking dal s JI‏ 

العمل بإحدى الطريقتين في الاعتماد على قوائم التوقف السابقة لإضافة 
الصور واعتمادًا على تحليل تعامل مستخد مي الويب مع تلك المجموعات سواء 
باستبعادها al‏ باختيارها. وهي إحصاءات تساهم في ترشيح مجموعات 
الصور. 

السماح بإتاحة مجموعات الصور لتحكيم العنصر البشري سواء أمام 
المستفيدين ام امام مصممي مرشح الصور. 

إمكانية تحكم المستفيدين في تحديد مستوى ترشيح الصور قبل إجراء 
ccl‏ وزيادة خيارات التحكم في مرشح الصور حيث لا تقتصر فقط على 
غلق أو فتح مرشح الصور. 

إلى تكامل هذه التقنية بتحليل محتوى الصورة بأبعاده ؛ البنية والشكل واللون. 
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تشكل الخصائص السابقة أساس بناء مرشح بحث للصور الرقمية على 
الويب. غير أن ضبط عمل هذه المرشحات يعتمد أولا على الاتجاهات التجارية 
لمحركات بحث الويب» فإن درجة اهتمام محرك البحث باستخدام المرشحات 
تنبني على الهدف العام لمجموعات الصور داخل قاعدة البيانات. وحري بالذكر 
هنا انه لا مجال للمقارنة في ذلك بين قواعد بيانات الصور ومحركات البحث ؛ 
حيث إن الأولى تعتمد منذ البداية على العنصر الإنساني المدرك تماما لطبيعة 
محتوى مجموعات الصور الرفمية. 


إن الخصائص السابقة قد صاغها الباحث اعتمادًا على الدور المهم الذي 
أداه مرشح البحث في رفع أو خفض مستوى الاستدعاء والتحقيق. غير أن هناك 
الكثير من الخصائص التقنية التي تدخل ضمن اختيار مرشحات الصور الجيدة. 
خاصة وأن هدف الترشيح لذاته هو الغاية الأهم في بعض البيئات مثل العربية 
والإسلامية. خلاف ما يترتب على ذلك من تأثر معاملات الاسترجاع. واشتق 
الباحت الخضائض التقنية لمرشع الصوز الملائمة للضوز الرقمية Aue pall‏ مما 
جاء عن مرشح content-protect‏ وهو من أبرز مرشحات الصور المستخدمة في 
مجال الويب. كما يلي OF;‏ 


7 يمتلك مرشح البحث إمكانية تحليل كلمات النصوص أو قوائم مسارات مواقع 
الويب. فضلا عن التفاعلية في تحديث وتغيير بيانات تلك القوائم. 
إمكانية ترشيح أكبر مجموعة من الصور بأقل وقت ممكن. 

> ملاءمة الأشكال المختلفة من لفات صفحات الويب» والتعامل مع مختلف 
AS‏ الصور الرفمية مثل .PNG, GIF...‏ 

> تصميم واجهة تطبيق سهلة الاستخدام أمام مستفيدي الويب/ خاصة غير 
الماهرين منهم. 

” إمكانية التكامل مع جميع محركات البحث على اختلاف تخصصاتها 
الموضوعية؛ واشكال المصادر الرفمية. 


Content Protect Web Filtering. Content watch, 2005, cited 1/9/2005, ©) 
http://www.contentwatch.com/products/contentprotect.php 
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إلى الوضع الآمن عند تحديد المستفيد للبحث في شكل الصور فقط. 

إمكانية التحكم والتغيير والصيانة الدائمة لمرشح البحث في إعدادات العمل 
المختلفة؛ مثل طريقة الاتصال واختلاف مراحل البحث. 

لمرشح البحث. 

إمكانية إدخال التعديلات من جانب المستخدم ؛ ذلك لضبط وتحديد قوائم 
التوفف بحسب حاجة المستفيد. 

إمكانية العمل برسائل المساعدة الداعمة للتفاعل مع المستفيدين أثناء ضبط 
خيارات البحث في مرشح الصور. 

إمكانية العمل بلغات مختلفة ؛ سواء لغات واجهات البحث أم لغات الترشيح 
لمصادر معلومات الويب. 

إمكانية إدخال التحديثات تلقائيا اعتمادًا على ملامح بحث المستفيدين 
ومصادر المعلومات موصع الترشيح. 


إن الخصائص السابقة يمكن الاعتماد عليها في تشكيل مرشح الصور 


العربي الداعم لخصائص اللغة العربية. فضلا عن إمكانية التحكم في وضع هذا 
المرشح ضمن مراحل الإضافة والتزويد لمجموعات الصور أو عند إجراء البحث 
والاسترجاع من جانب المستفيد. 


نهاية» يمكن صياغة الخصائص السابقة في محاور أساسية يمكن دراستها في 
واقع عمل محركات بحث الصور كما يلي:- 


(١ 
(Y 
(Y 
(t 
(o 


تفعيل مرشح الصور داخل محركات بحث الصور. 
مرشح الصور بين مراحل عمل محرك الصور. 
العلاقة بين مرشح الصور ومستخدم الصور الرقمية. 
نمط الترشيح المتبع داخل مرشح الصور. 


فاعلية مرشحات الصور داخل محركات البحث. 
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٥‏ مرشحات الصور داخل محركات البحث 

تختلف محركات بحث الصور في درجة اهتمامها بترشيح مجموعاتها من 
الصور الرفمية. وعلى إثر هذا الاختلاف تختلف درجات استخدام مرشحات البحث 
في عدم وجودها داخل بعض المحركات إلى وجودها دون خيارات الترشيح داخل 
البعض الآخرء ثم إلى التفاعلية مع المستفيد في تحديد خصائص وحدات الصور 
المراد استدعاؤها داخل قاعدة البيانات. وقد عملت أربعة فقط من محركات بحث 
عينة الدراسة على استخدام مرشحات البحث لمجموعاتها بدرجات متفاوتة. وهذه 


المحركات هي:- 
AltaVista .١‏ 
Corbis ۲‏ 
Fast .Y‏ 
Google t‏ 


وسوف يتم دراسة ably‏ ترشيح الصور الرقمية داخل محركات البحث تبعًا 
للمحاور المذكورة؛ وهي كما يلي :- 
6 تفعيل مرشحات الصور:- 

تختلف فاعلية مرشحات الصور داخل محركات البحث السابقة في استرجاع 
الصور بحسب طبيعة خيارات البحث بهاء وبالنظر إلى الجدول رقم )١-0(‏ يتضح 
مستوى فاعلية مرشحات الصور في هذه المحركات. كما يلي :- 


الجدول رقم )1-0( مرشحات الصور داخل محركات بحث العينة 


| Google Fast | Corbis | Altavista | محركات البحث‎ | 
x له‎ x | x درجة الاستخدام | فتح / غلق‎ 

| 4 x | 54 7 54 | REE | | 

| "4 | x | x 1 v | ام الترشيح بحسب الشكل‎ | 
X | A | v v | 2354 وضع كلمة‎ | 
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تتسم مرشحات الصور داخل محركات بحث العينة بخصائص تفعيل JS‏ 


محرك على (Bam‏ وهي كما يلي :- 


ij 


ta 


aali :‏ محركات بحث Google,AltaVista‏ خيارات الترشيح على استحياء, 


S‏ افتصر محرك البحث Fast‏ على طرح خاصية تنشيط مرشح الصور أو 


غلقه دون التطرق إلى خيارات ترشيح ase]‏ ويأتي ذلك من طبيعة 
محرك Fast‏ كمحرك متعدد البحث واعتماده على البحث فى محركات 


بحث أخرى. 


: غلبت الطبيعة التجارية لمحرك البحث Corbis‏ على أداء مرشح البحث ؛ 


حيث Corbis C‏ خصائص مرشح البحث بعد التسجيل في فائمة 
مستخدمي Corbis‏ وحري بالذكر أن Corbis‏ لا يستخدم مرشح البحث 
لحجب مجموعات الصور الخارجة. وإنما لتهذيب النتائج ورفع درجه 
التحقيق فقط داخل النتائج المسترجعة؛ أي أنه أداة من أدوات الاسترجاع 
فقط. 


٥‏ العلاقة بين مرشح الصور ومستخدم الصور الرقمية 


يمكن لمحرك بحث الصور تحديد درجة التفاعلية بين مستخدم الويب 


ومرشح الصور داخل قاعدة البيانات. وكلما كان التفاعل بين مرشح الصور 
والمستخدم cde (le‏ درجة تحقيق الصور المسترجعة داخل قاعدة بيانات 
محرك البحث. ويهدف هذا العنصر إلى قياس المدى الواقعي لهذا التفاعل من 
خلال التعرف إلى الخيارات المتاحة أمام مستخدمي مرشح الصور؛ سواء 
أكانت في تسجيل ملامح البحث أم في ضبط خيارات استدعاء مجموعات 
الصور. ويسجل الجدول رفم (Y-0)‏ جوانب التفاعل الممكنة بين مرشح الصور 
ومستخدمها:- 
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الجدول رقم (Y-0)‏ 
يوضح العالاقة بين مرشح الصور ومستخدم الصور 


الشجيل متابعة أثناء v 5 NK‏ 2 » 

x X x K هلامج تلقي الكلمات الدالة‎ 

7 x x w Rie ee eee E الترشيح‎ 
تسجيل ملامح المستفيدين‎ 

x Xx x x ^ iw ejs « 5 5 

x x x x البحث‎ 


تحديد مستوى الترشيح 


يوضح الجدول رفم )70 (Y‏ ما يلي : 

أولا ٠‏ يمتمد مرشح البحث داخل محرك الصور Fast‏ على أدنى درجات 
التفاعلية ؛ حيث لا يتيح أي من خيارات التعامل مع المرشح سوى فتح أو 
غلق عمل مرشح الصور. 

ثانيًا : عمل محركي Google AltaVista‏ على فتح خيارات التفاعل لاختيار JS‏ 
المعلومات المراد ترشيحها سواء أكانت المعلومات النصية أم المعلومات 
المصورة al‏ كليهما. Lein‏ استخدم Corbis‏ مرشح البحث daas‏ عند إعادة 
البحث داخل النتائج. 

ÉG‏ : افتقرت محركات البحث جميعها إلى مرشح بحث يتيح لمستخدم الصور 
طرح ملامحه الموضوعية والتفاعل في ضبط سياسات التوقف عن 
مجموعات الصور. ووضح ذلك في عنصر التحكم بمرشح البحث. 


06 نمط الترشيح المتبع داخل مرشح الصور 

تتبع مرشحات الصور طريقتين في ترشيح المعلومات الرقمية المصورة ؛ 
حيث تستخدم الكلمات الدالة في الترشيح أو أن تعتمد في ترشيحها على تحليل 
عناصر البنية والألوان. ويهدف هذا العنصر إلي التعرف إلى واقع الترشيح داخل 
محركات بحث العينة. كما يوضحها الجدول رقم )0- =i (Y‏ 
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الجدول رقم )0- (Y‏ 
تقنية الترشيح داخل مرشح الصور 


Googie Fast Corbis | AltaVista | محركات البحث‎ 
1 GEE ar ا‎ 
4 hd | v | 4 | إيقاف الكلمات أو الميتاداتا‎ | 
x الترشيج | إيقاف الروابط : ا‎ 
x x x | x | aala | النصي‎ 
X X X x الألوان‎ me 
x x x x الترشيح | قيم الألوان‎ 
x x x x التحليلي | الشكل‎ | 
X x x X الصورة‎ 25. | 


كما يوضح الجدول رفم )0- (Y‏ فإن محركات البحث تعتمد في ترشيح 
الصور daas‏ على الكلمات المفتاحية الواردة ضمن متن أو حقول صفحة الويب. 
وقد افتقرت مرشحات الصور إلى تبني أي من تقنيات الترشيح بشكلها الكامل ؛ 
حيث تفتقر محركات البحث ذاتها إلى الكفاية في تكشيف ومعالجة الصور 


الرفمية. 


6 مرشح الصور بين مراحل عمل محرك الصور 

تختلف مرحلة عمل مرشح البحث داخل محركات الصور بحسب كيفية 
توظيف مرشح الصور. حيث يمكن لمحرك البحث وضع سياسة ثابتة في بناء 
وتنمية مجموعاته من الصور الرقمية. وعلى ذلك فإن أفضل مرحلة لتوظيف مرشح 
البحث هي أثناء الإضافة وخلال عمل برنامج الزاحف في تصفح صور الويب. وهو 
الأسلوب الواجب اتباعه في محركات البحث ذات الثقافة العربية والإسلامية. حيث 
توجد القيم الثابتة غير القابلة للتحديث والتغيير. أما إذا أراد محرك البحث ترك 
سياسات الترشيح لمستخدمي الصور وتلبية مختلف الحاجات الموضوعية OB «eel‏ 
مرشح الصور ينشط فقط في مرحلة البحث واستدعاء مجموعات الصور. 
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الجدول رقم ala pa (t-0)‏ الترشيح بين مراحل عمل محرك البحث 


x x x x الترشيح أثناء الإضافة‎ 
| x x | x | x | الترشيح أثناء التكشيف‎ 
| "4 4 | v | v | الترشيح أثناء البحث‎ 


يوضح الجدول رقم )£70( أن محركات البحث جميعها يتيح تفعيل 
مرشحات الصور في dauo‏ مجموعاته إلى مستخدمي الصور الرقميةء بما يمكن 
هؤلاء المستفيدين من استدعاء مختلف موضوعات الصور الرقمية. ويمكن لمحرك 
البحث اتباع أسلوب الترشيح أثناء التكشيف من خلال مضاهاة ملامح المستفيدين 
الموضوعية والكلمات الدالة على الترشيح بالكلمات الدالة على محتوى الصور 
الرقمية أثناء تنظيم مجموعات الصور داخل قاعدة البيانات. 
6٥‏ قاعلية مرشحات الصور داخل GIS pore‏ البحث 

إن وجود مرشح بحث داخل محركات البحث العربية ليس هو الغاية في حد 
ذاته. Laf‏ غاية الترشيح هو إثبات فاعلية غلق أو cabs‏ مجموعات الصور غير 
الملائمة لملامح مستخدمي محرك البحث. وقد عمد الباحث إلى طرح مجموعة 
من المصطلحات على مرشحات الصور t "sex, sexual" fia‏ وهي أكثر المصطلحات 
Jala Lad,‏ البيئة العربية والإسلامية في استرجاع الصور. وذلك لاكتشاف مدى 
فاعلية تلك المرشحات في استدعاء الصور. واختار الباحث الصفحة الأولى من 
صفحات عرض النتائج لفحص دفة مرشح البحث في منع محتوى الصور الرفمية:- 


الجدول رقم )0-0( مستوى فاعلية مرشحات الصور 
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=b وذلك كما‎ TOTNM 


ij 


ثانيًا 


: افتقر محرك البحث fast‏ إلى فاعلية مرشح الصور بالدرجة التي تساوت 


بها طبيعة الصور الرقمية المسترجعة قبل وبعد تنشيط مرشح الصور به. 


: حاولت مرشحات البحث داخل gle Google, Corbis‏ الوصول إلى محتويات 


الصور الرفمية الصريحة explicit images‏ غير أنها استدعت محتويات 
الصور التي تقترب من هذا الموضوع. ويرى الباحث أن مثل هذا الترشيح 
بلغ من النقص ما يساوي به فشل مرشح البحث في غلق الوصول إلى هذه 
المصطلحات كاملة. خاصة وأن هذه المحركات تعتمد على الترشيح 
بالنص باستخدام الكلمات. 


: تمير مرشح الصور داخل محرك البحث cum t AltaVista‏ أغلق مرشح 


البحث تماما الوصول إلى أي نتائج تتعلق بهذا المحتوى. وكانت نتائجه 


أن يتم تغيير خصائص البحث مره اخرى. 


٥‏ العلاقه بين الترشيح ومعاملات نظم الاسترجاع 


إن 55b‏ مرشحات البحث على مجموعات الصور المسترجعة ينعكس بدوره 


على قيمة معاملات نظم الاسترجاع مثل الاستدعاء والتحقيق والفقد. ويأتي ذلك 
من تحكم مرشح البحث بكم وكيف مجموعة الصور المسترجعة داخل فاعدة 
البيانات. ويرى الباحث أن تأثير مرشح الصور على معاملات الاسترجاع يتوقف على 
مرحلة استخدام مرشح الصور داخل محرك البحث.وذلك كما يلي :- 


: والتنظيم‎ PCI d في مرحلة‎ TI 1/۸/0 


قاعدة بيانات المحرك ؛ ذلك لأن دور مرشح البحث ينتهي عند إضافة الصورة 
وتنظيمها Jala‏ قاعدة البيانات, أما معاملات البحث فهي تأتي مع المستفيد في 
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: ثانيًا: في مرحلة البحث‎ ٥ 
حيث يمكن لمرشح الصور التدخل في كم وطبيعة مجموعات الصور‎ 
المسترجعة بأحد الأسلويين التاليين:-‎ 


۵ ترشيح النتائج 

وهو أن يترك مرشح الصور إستراتيجية البحث المصاغة من جانب 
المستفيد تمر إلى قاعدة البيانات بالشكل الذي ارتضاه المستفيد من كلمات 
البحث. ثم يبدأ عمل مرشح الصور عند استجابة قاعدة البيانات بإخراج 
مجموعات الصور الرقمية المطابقة لاستراتيجية البحث ؛ حيث يبدا مرشح الصبور 
بمضاهاة مجموعات الصور المسترجعة بقوائم التوقف عنده أو بتحليل مجموعات 
الصور التحليل اللوني ليقرر أي من هذه الصور يمر إلى واجهة عرض النتائج. 
وأي منها يتم استبعاده. وهذا المستبعد يمكن للباحث أن يطلق عليه نسبة الفقد 
من مجموعات الصور لكونها طابقت احتياجات المستفيد الموضوعية وخالفت 
سياسة الترشيح داخل بيئة محرك البحث. ويوضح الشكل رقم (V-0)‏ دور وموقع 
مرشح الصور :- 


تحليل الكلمات 
لس له 


sh‏ نتائج البحث 
"m‏ 
A‏ 
U^‏ نتائج مرفوضة 


FILTER 


الشكل رقم (ه- (V‏ 
مرحلة مقترحة لعمل مرشح الصور في ترشيح نتائج البحث 
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6 ترشيح إستراتيجية البحث 

وهو أن يتحكم مرشح الصور بضبط كلمات البحث وإعادة صياغة 
إستراتيجية بحث المستفيد قبل تمريرها إلى قاعدة البيانات. وعلى ذلك تصل 
كلمات البحث إلى قاعدة البيانات بما يوافق سياسة الترشيح داخل محرك بحث 
الصور. ومن ثم تستدعي قاعدة البيانات مجموعات الصور التي أقرها مرشح 
الصور. ويوضح الشكل رقم (A-0)‏ دور وموقع مرشح الصور:- 


الشكل رقم (A-0)‏ 
مرحلة مقترحة لعمل مرشح الصور في ترشيح كلمات البحث 


تؤثر مرحلة الترشيح على مجموعات الصور المسترجعة بفقد نسية من 
الصور المستدعاة المتصلة بموضوع المستفيد»غير أن الهدف الحقيقي وراء تفعيل 
اتباعها. دون النظر إلى ما يخلفه أداء مرشح البحث من فقد لمعلومات تتصل 
بموضوع البحث. 


٥‏ الخاتمة 
تهدف محركات بحث الصور الرفمية إلى تلبية احتياجات المستفيدين من 


المعلومات المصورة. غير ا الصور الرفمية باعتيارها مصدر معلومات يحتاج إلى 
ضبط وتحكم بما يلائم طبيعة المستفيدين والبيئة التي يعمل بها محرك بحث 
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الصور. وتستخدم محركات الصور مرشحات الصور کبرامج مساعدة على تنقية 
وترشيح المعلومات المصورة داخل فاعدة بيانات محرك البحث. وتنتهج مرشحات 
الصور أساليب مختلفة لترشيح الصور باستخدام الترشيح النصي أو الترشيح 
التقني بتحليل المحتوى. وتحتاج مرشحات الصور داخل محركات الصور العربية 
إلى مجموعة محددة من الخصائص لكي يتماشى أداؤها وطبيعة الثقافة الإسلامية. 
وقد حاول هذا الفصل منافشة خصائص وعمل مرشح الصور. 


4 
5 
e 
0 
de 
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الفصل السادس 


مواصفات محرک بحث صور 
يدعم اللغة العربية 


5 التمهيد 

5 مراحل تكشيف الصور الرقمية 

7 مراحل عمل محرك الصور 

5 مراحل عرض النتائج 

5 ملامح احتياجات المستفيدين في محرك 
البحث 


5 الخللاصة 


مواصفات محرك بحث صور 
يدعم ALII‏ العربية 


5 التمهيد 


عرضت الدراسة في الفصول السابقة الجوانب والأركان التي يقوم عليها 
محرك بحث الصور من حيث الإضافة والإعداد الفني ومرحلة البحث والاسترجاع. 
ويأتي هذا الفصل من الدراسة كثمرة لدراسة بحث واسترجاع الصور الرقمية. هذا 
إلى جانب التعرف إلى المعالجة الملائمة لخصائص اللغة العربية. ويعتمد الباحث 
في هذا الفصل في وضع مواصفات محرك بحث الصور الثابتة الداعم للبحث باللفة 
العربية على النموذج الموضح لمراحل العمل داخل محركات البحث؛ والذي وضعه 
Ibrahim A. Al-Kharashi‏ في إطار الحديث عن مشكلات استرجاع اللغة العربية في بيئة 
Pag‏ ويقدم الباحث هذا الشكل باعتباره نموذجًا مرئيًا لمحرك بحث الصور 
تتوفر فيه مجموعة الخصائص المطلوبة لصياغة محرك بحث صور ثابتة داعم da‏ 
العربية. وبالنظر إلى ذلك الشكل يمكن استيضاح الخطوات التالية لمحرك البحث 
المقترح. ويتكون سياق عرض محرك بحث الصور من العناصر التالية :- 


56 مراحل تكشيف الصور الرقمية 
يبنى عمل مؤسسات المعلومات على اختلاف درجاتها (المكتيات. المكتبات 


المتخصصة. مراكز المعلومات). أو على اختلاف بيئاتها (مراصد البيانات أو 


Al-Kharashi, Ibrahim A. A Web Search Engine for Indexing, Searching and Publishing (1) 
Arabic Bibliographic Databases, King Abdul Aziz City for Science and Technology, 
Computer and Electronics Research Institute, [2001?] visited 31/12/2002, 
http://www.isoc.org/inet99/proceedings/posters/085/ 
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محركات بحث الويب) جميعًا على القيام بدور الوسيط بين المرسل والمتلقي في 
إتمام عملية الاتصال. وتحتاج البيئة الرقمية إلى التنظيم الفني لوسائط المعلومات 
تماما كما تحتاج إليه المكتبات ومراكز المعلومات. ويمكن القول إن الفارق بين 
البيئة التقليدية والبيئة الرقمية هو فارق في الدرجة وليس في النوع؛ حيث تهتم 
محركات البحث بمحتوى صفحات الويب أكثر من اهتمامها بالوسيط كما هو الحال 
في عمل المكتبات. 


5 الاعداد الفني للصور الرقمية 


عند التعامل الببليوجرافي مع الصور الرفمية تحويلها إلى وسيط النص المعتمد 
على الكلمة. ويرجع ذلك إلى أن تنظيم واسترجاع النصوص داخل قواعد بيانات 
تكشيف الصورة بطبيعتها دون تحويلها إلى وسيط النص الداعم للتحليل الموصوعي 
أو فنية لا تتصل من قريب أو بعيد بعمل اختصاصيي المعلومات في تنظيم 
المعرفة. وعلى هذا كان حرص الياحث على افتراح مجموعة من حقول البيانات 
الييليوجرافية الواصفة ماديا للصور الرقمية اعتمادًا على معيار ديلن كور لوصف 
ملفات الصور الرقمية. وهو ما ela‏ في الفصل l‏ ثم العمل على تحديد 
خطوات لوصف محتوى الصورة باستخدام التكشيف. 


فرت جنا b aa e‏ اى uicta i‏ ينعا فاه اتن xil‏ 
ومراعاة إدخال مجموعة حقول الوصف الببليوجرافي الواصفة للصورة والمعبرة عن 
المحتوى الموضوعي لها؛ حيث إن محرك البحث لا يوفر تلك الخاصية لملفات 
الصور فهي لا تكشف إلا ما تجده من حقول أو بيانات عن الصورة (الميتاداتا). 
وفد ذكر Anne Callery‏ وهو أحد المفهرسين داخل دليل البحث Yahoo‏ اعتماد دليل 
البحث على مجموعة من المعايير لوصف صفحات الويب؛ حيث تخضع صفحات 
الويب إلى تحليل مادي وموضوعي من جانب هؤلاء المفهرسين لاستخراج أهم 
الموضوعات التي تعالجها صفحة الويب ومن ثم التعبير عن تلك الموضوعات 
بالكلمات المفتاحية الملائمة للموضوع. هذا Waa‏ عن استخراج بعض البيانات 
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الواصفة Jie‏ العنوان ومسار صفحة الويب والمؤلف... إلخ. وذلك للسماح بالحد 
الأدنى من وصف صفحات MONET‏ 


وتعرض العناصر التالية المقترحات الخاصة بشأن الإعداد الفني للصور 
الرفمية على الويب داخل محركات بحث الصور في اللغة العربية:- 
5 تحليل ملف الصورة إلى عناصر محددة 

يتركز الحديث في دراسات فهرسة مصادر الويب على العناصر الأساسية 
للوصف الببليوجرافي لهذه المصادر؛ مثل ما ذكرته فواعد الفهرسة العالمية لملفات 
الحاسب International Standard Bibliographic Description for Computer files [ISBD (CF)]‏ 
والتي تم تسميتها في الطبعة الثانية لها باسم International Standard Bibliographic‏ 
(Description for Electronic Resources [ISBD (ER)]‏ إلا ان jis‏ هذه القواعد تتعامل مع 
صفحات الويب بشكلها العام ولا تختص هذه القواعد بوصف ملفات الصور أو 
الفي؛.يو أو الصوت. ويختلف الوصف الببليوجرافي من وسيط إلى آخر Las‏ لاختلااف 
الشكل المادي. مما يدل على احتياج ملفات الصور إلى قواعد جديدة للتعامل مع 
شكل وسيط الصور الرقمية الثابتة. 


ويعمل برنامج المكشف على تحليل الصفحة المصدرية للصورة للخروج 
بالكلمات المفتاحية التي تصف محتوى هذه الصورة؛ إلا ان الوصف الببليوجرافي 
للصورة الرقمية يجب ألا يتعدى ملف الصورة ذاتها التي تكون الصورة فيها أحد 
أجزاء هذا الملف. وتقف هذه المرحلة عند تعرف برنامج المكشف على مجموعة 
من البيانات الببليوجرافية التي يتوجه إليها البرنامج بحسب أماكن سابقة التصميم 
في ملف الصورة الرقمية. وقد حدد معيار دبلن كور لوصف الصور مجموعة من 
العناصر المكونة للتسجيلة الببليوجرافية. إلا أنه توجد بعض العناصر الأخرى 
المهمة في تحديد خصائص الصورة مثل درجة الوضوح ودرجة اللون كمية وحدات 
البايت . وتخرج Jia‏ هذه العناصر yer‏ باعتبارها رموزًا واصفة للشكل المادي 
للصورة الرقمية يتم استخدامه وفقا لما أقرته التعليمات داخل برنامج المكشف. 
ويجب أن يعمل المكشف على استخدام محتوى الصفحة المصدرية بجانب ملف 


Callery, Anne. Yahoo! Cataloging the Web, Yahoo! Inc., 1996, visited at 20/10/2003, (1) 
http://www.library.ucsb.edu/untangle/callery.htrnl 
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الصورة لإخراج العناصر الواصفة للصورة الرقمية الوصف المادي. ويوضح الشكل 
رقم )17( لعمل محركات البحث أن صفحة الويب تشكل في مجملها البيانات 
الخام التي يعمل على تنظيمها وتحليلها برنامج المكشف. وتأتي الصلة بين 
الوصف المادي ومحتوى الصفحة المصدرية فقط في التعرف إلى المواصفات 
المادية للصورة مع الحقول الخاصة بالصفحة مثل المسار والعنوان. 


الشكل رقم )١-6(‏ 
يوضح مراحل عمل محرك بحث الصور الرقمية 


وتعتمد محركات البحث العامة أو المتخصصة على البنية الثابتة لصفحات 
الويب في ضم وإعداد هذه الصفحات الإعداد الفني. ومن ثم فإن برنامج المكشف 
يجب أن يملك التعليمات المحددة لأماكن البيانات الببليوجرافية التي يتم تجهيزها 
في المرحلة التالية لوضعها في شكل الحقل الببليوجرافي. ويتمثل ذلك في حقول 
اللغة المعيارية HTML metatags‏ الواصفة لمحتوى وشكل الصورة. 

والجدير بالذكر أنه في هذا المرحلة تتحد بنية صفحات الويب العربية 
والإنجليزية في استخدام حقول ومحارف اللفة الإنجليزية. و يرجع ذلك إلى عدم 
تعريب لعناصر برمجة اللغة المعيارية SHTML, XML‏ حيث لا يوجد في «Lu‏ الصفحات 
العربية ما يقابل عناصر «Head», <Title>,<Body> : Jie‏ أو غيرها من العناصر 
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المستخدمة في تصميم صفحات الويب؛ إلا أن التقنيات التي يمكن استخدامها 
داخل محرك الصور العربي قد تجعل من السهل إدخال النصوص العربية في 
Meta Keyword, Meta Title Jie polic‏ مع الإبقاء على رؤوس هذه العناصر بلغتها 
الأصلية. و مثالا على ذلك لحقول صورة رقمية:- 

ail! نهر‎ «meta title» 


«meta keyword»‏ المياه. المراكب. النهر. «fail‏ مصرء الجمالء الوفاء 


5 تحويل العناصر إلى حقول ببليوجرافية 
gu‏ توضع في الشكل المناسب لتفريغها في الاستمارات الآلية ذاتيا داخل قاعدة 
المكشف. ومن الجدير بالذكر أن الباحث لم bab‏ استخدام كلمة مفهرس بدلا من 
المكشف في الإنتاج الفكري الأجنبي على الرغم من قيام برنامج المكشف بالتعبير 
برنامج المكشف على إخراج الكلمات المفتاحية وتحليل المحتوى دون الوصف 
دون حقول الوصف المادي. 

ويقترح الباحث هنا تغذية محرك بحث الصور بشكل ثابت من ترتيب 
الحقول الببليوجرافية يتضمن مختلف الحقول الببليوجرافية الواصفة للشكل المادي 
والمحتوى الموضوعي للصورة. ويقف برنامج المكشف عند تجهيز الحمول 
العربية من خلال إدخال نماذج ومحارف اللفة العربية داخل برنامج المكشف في 
محرك الصور الداعم dal‏ العربية. 


5 تكوين التسجيلة الببليوجرافية 
بعد أن ينتهي برنامج المكشف إلى إعداد التسجيلة النهائية للصورة الرقمية 


المكونة من عناصر الوصف المادي والوصف الموضوعي. ويقترح الباحث أن تكون 
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التسجيلة الببليوجرافية الكاملة للصورة الرقمية العامة فى اللغة العربية على الشكل 
التالي:- l‏ 

العنوان : 

الفنان» المصور (المؤلف) : 

الموضوع : 

وصف الموضوع ( المحتوى) : 

تاريخ التقاط الصورة : 

تاريخ صنع الصورة الرقمية : 

تاريخ وضع التسجيلة : 

الناشر : 

شكل ملف الصورة : 

حجم ملف الصورة : 

أبعاد الصورة : 

اللون : 

تعريف الصورة : مسار الملف : 

مصدر الصورة على الويب (في alla‏ محرك ألبحث موضع التقاط الصورة 
من الويب) : 
لغة ملف الصورة : في حالة المحركات متعددة اللغات : 

تغطية الصورة : المكان : 

حقوق نشر الصورة : 

ويشير النموذج السابق إلى تعليمات بنية التسجيلة الببليوجرافية. على أن 
تكون هذه التسجيلات الببليوجرافية فى قاعدة بيانات مستقلة تختلف عن تلك التى 
يتم تجهيز البيانات الخام بها. ويستكمل برنامج المكشف الشق الأول من الإعداد 
الفني إذا ما كونت التسجيلة الببليوجرافية للصورة الرقمية. 
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5 اختيار الكلمات المفتاحية في ملف الصورة (التكشيف) 


لم تكن محركات بحث الويب أو المحددة قد أولت اهتمامًا للوصف 
الببليوجرافي بقدر ما كان في وصف المحتوى والموضوع. وعلى الرغم من أن 
الوصف الموضوعي له الأهمية الكبرى في استدعاء صور الويب؛ إلا أن إجراءات 
الوصف الببليوجرافي تحتاج إلى كفاية أكبر تجاه العناصر المادية وتكوين التسجيلة 
الببليوجرافية. ويعود هذا إلى استخدام الوصف الموضوعي لطريقة اختيار الكلمات 
المفتاحية ونقاط الاستدعاء في حالة بقاء النص المصاحب للصورة على ما هو 
عليه بعد وصف موضوع الصورة. 

وتعتمد النظم الآلية في تكشيفها لوسائط المعلومات الرقمية على طريقتين؛ 
تتمثل الأولى في إخراج الكلمات المفتاحية بأسلوبين إما بالاقتباس Extraction‏ أو 
بالاشتقاق Derived‏ أما الأسلوب الأول فيعمل نظام المعلومات في هذه الطريقة على 
استهراج الكلمات المذتاحية من بين كلمات النص الكامل اعتمادًا على مبدأ التكرار 
الذي جاءت به الكلمات ذات الصفة المفتاحية على الموضوع؛ ويتم حصر الأشكال 
المختلفة للكلمة الواحدة مع رد هذه الأشكال إلى الكلمة الأصلية ثم حساب عدد 
مرات التكرار بين كلمات النص والكلمة الدالة. أما الأسلوب الثاني فهو الاشتقاق 
ويعتمد على موقع الكلمة في النص كأن تأتي الكلمة المفتاحية في العنوان أو تأتي 
في العناوين الجانبية أو الكلمات التي تأخذ Ligh‏ مختلفًا أو شكلا xa‏ في الكتابة. 
مما يفيد معه أن هذه الكلمة ذات تأثير في التعبير عن الموضوع أو محتوى النص 
المصاحب لوسيط المعلومات» وتتخذ محركات بحث الويب جميعها طريقة الاشتقاق 
أسلوبا في تكشيف مصادر الويب. النصية وغير النصية؛ إلا أن الأمر يختلف بين 
نظم معلومات الويب والنظم الأخرى؛ ويعود ذلك إلى اتخاذ محركات البحث من كل 
كلمة من كلمات النصوص الرفمية مدخلا لاستدعاء مصدر المعلومات مما يعكس 
اعتماد نظم محركات البحث على الاشتقاق الكامل في تكشيف مصادر معلومات 
الويب. Lal‏ الطريقة الأخرى في التكشيف الآلي فتسمى التكشيف بالتعيين وتتم 
إجراءات هذه الطريقة من خلال استبدال نظام المعلومات لمجموعة الكلمات 
الواردة في النص بمجموعة من المصطلحات المختارة التي تعبر عن موضوع 
مصدر المعلومات الرقمي. ومن شأن هذا النوع من التكشيف الاعتماد على إجراءات 
أكثر كفاية من تلك التي تعتمد عليها نظم التكشيف بالاشتقاق. نظرًا لأن الواصفات 
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الموضوعية هنا Lai]‏ هي واصفات لموضوع الكلمات الأكثر UY‏ على الموضوع داخل 
LETT MER‏ 

ويجب التأكيد هنا على أن التعامل المعياري وغير المعياري مع مفات 
الصور الرقمية يؤثر بدوره على فاعلية التكشيف داخل محرك البحث. حيث بؤدي 
البناء المعياري لملفات الصور الرقمية إلى وضع ضوابط ومواصفات مقننة من 
جانب المكشف لاختيار الكلمات المفتاحية داخل ملف الصورة: Lal‏ في ala‏ التعامل 
غير المعياري وهي حال الويب. الآن فإن برنامج المكشف يلجأ إلى الاعتماد على 
النص المحيط بإطار الصورة داخل صفحات الويب» مما يترتب على ذلك اختيار 
أكثر الكلمات دلالة على الموضوع من بين كلمات نص يتسم في ذاته بالضعف في 
التعبير عن محتوى الصورة. ويقترح الباحث اعتماد الشكل المذكور في الفصل 
الثاني والمقدم لبناء ملفات الصور الرقمية على الويب؛ حيث يتم تغيير معايير 
الانتقاء داخل برنامج المكشف اعتمادًا على التقنين الحديث لملفات الصور. ويوضح 
الشكل رقم (5-5) المراحل المقترحة لتكشيف الصور. 

ويقترح الباحث اعتبار طريقة الاشتقاق منهجًا لاستخراج الواصفات التي 
تعبر عن محتوى الصور الرقمية. وذلك اعتمادًا على بنية صفحات لغة الترميز 
المعيارية HTML‏ ويكون لموقع كلمات النص الاعتبار الأول في إخراج الكلمات 
المفتاحية بدلا من مرات التكرار التي جاءت به الكلمات. وتتميز بنية صفحات 
الويب باحتواء موافع نصية تمثل نقاط 259 لعرض الكلمات المفتاحية عن المحتوى 
مثل العنوان أو المسار URL‏ أو حقلي Meta Key word‏ وووه 016:3 نظرًا لما تحويه هذه 
الحقول من مصطلحات يعبر بها مصممو صفحات الويب عن الموضوعات التي 
تتضمنه هذه الصفحات. وفد اكد Robert Corfman‏ على أهمية حقول metatag‏ في 
الحصول على الكلمات المفتاحية للتعبير عن محتوى صفحات الويب دون عرضها 
أمام مستخدمي محرك البحث. وهو ما يعني الاعتماد على بنية مقننة لبناء ملفات 
صور الويب لكي تتوافق مع إجراءات وتعليمات عمل برنامجي الزاحف والمكشف 
لالتقاط الصورة الرقمية وتحليلها.''' ويعد هذا الاعتماد على كلمات الصفحات 


- - احمد بدر. التكشيف والاستخالاص / تأليف أحمد بدر.محمد فتحي عبد الهادي. ناريمان إسماعيل‎ )١( 
QYYATYYA القاهرة. مصر: دار قباء. ۲۰۰۱- . ص ص‎ . -١.ط‎ 

Corfmin, Robert. Satisfying the Search Engines - Key Words Meta Tag, the author, 1998, (Y) 

visited6/2/2003,: http://www.corfman.com/robert/CityU/SearchEngine/keywords.htm 
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صفحة البحث 
search‏ 


الاسئئة حول paqpa‏ عة اتصور 


المرلحل المقترحة لتكشيف الصور داخل محرك بحث الصور 


الشكل رقم (Y-*)‏ يوضح المراحل المقترحة لتكشيف الصور 
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المصدرية أو الكلمات المصاحبة للصورة أحد ثلاثة أجزاء لتكشيف الصورة؛ حيث 
يتمثل الجزء الثاني في إشراك المستفيدين لإعطاء الكلمات المفتاحية على محتوى 
الصورة المعبرة عن ca gill‏ أما الجزء الثالث فهو عبارة عن التعديل النهائي من 
جانب المكشف (الإنسان) لاستكمال المستويات المختلفة لتكشيف الصورة الرقمية. 
ولقد أكد ImadHamdan‏ في الحديث عن بناء صفحات HTML‏ أن مسار أو عنوان 
صفحة الويب يؤدي دورًا Lage‏ في تحديد اهتمام محركات البحث بصفحة الويب 
والتكشيف الخاص بها. وأكد Hamdan‏ على أن مصممي الويب يغفلون أهمية اسم 
المجال في صفحة الويب؛ حيث يمكن إضافة المصطلحات الواصفة والمحددة 
لموضوع الصفحة. هذا فضلا عن استخدام اسم المجال الإضافي ومثالا على ذلك 
فإنه إذا ما أرادت شركة لبيع ذاكرة الحاسب إنشاء صفحة على أن تستخدم مسارًا 
يحتوي على وصف الشركة مكل www.yoursite.com/computers/memory.html‏ بدلا من 
مسار لا يعطي ذلك التعبير مثل الو كا ويعكس 
هذا تأثير عناوين صفحات الويب في الاسترجاع ومن ثم رفع LES‏ التحقيق إذا ما 
اعتمد محرك البحث على مسار الصفحة في التكشيف والاستدعاء والترتيب. 


وضي توصية لاحقة لإنشاء صفحات الويب. saa‏ أكد Hamdan‏ أهمية حقلي 
العنوان والكلمات المفتاحية في إبراز الكلمات المفتاحية على موضوع | موضوعات 
صفحة الويب» كما أن تكرار الكلمات داخل متن صفحة الويب من شأنه التأكيد على 
فاعلية هذه الكلمات المتكررة في تكشيف صفحة الويب. ويمكن الاستفادة من ذلك 
في التأكيد على الكلمات المفتاحية التي تعبر عن محتوى الصور الرقمية داخل 
بالصور الفوتوغرافية داخل صفحة الويب. 


العناصر التي يمكن شرحها كما يلي :- 


Imad Hamdan. Web Site Promotion Techniques for Top Search Engine Listings The (1) 
Internet Marketing Warriors, 2003, visited at 11/9/2003, 
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5 مستويات التكشيف للصور الرقمية 


إن العلاقة بين الصورة والنص تسیر دائمًا في إطار توضيح الصورة 
لموضوعات النص وليس العكس. وهذا الأمر هوما يمكن ملا حظته في الصور 
الإعلامية المصاحية للمقالات الصحفية. أو تلك الصور المصاحبة لمتن الكتب أو 
الصور المصاحبة لمقالات الموسوعات. وتحتاج الصورة عند تكشيفها إلى تبادل 
الوظائف مع النص لتوفير وصف أكثر دقة لمحتوى الصورة. وتتميز صفحات الويب 
ذات الألوان المتزاحمة باستخدام الرسومات والصور كدعامة لعرض محتوى 
النصوص الرقمية؛ أي أن الأمر هنا لا يختلف بين الصور التقليدية والصور الرقمية 
في بيئة الويب من حيث احتلال الصورة للمرتبة الثانية في عرض محتوى وسيط 
المعلومات. 


وتحتاج الصورة باعتبارها وسيط معلومات US a‏ إلى 2555 مستويات من 
التحليل السوضوعي؛ وهي أولا مستوى المناصر الأولية (uL)‏ في DSS‏ 
الصورة وتمثلها عناصر المحتوى المرئي والتي تقع عليها أعين المستفيدين عند 
المشاهدة الأولية للصورة. أما المستوى الثاني فهو العناصر الثانوية (خلفية 
الصورة) وتأتي في العناصر المكملة لشكل الصورة والمساعدة للعناصر الأولية في 
إعطاء الشكل الكامل للمحتوى. Lal‏ المستوى الثالث فهو البعد غير المرئي 
( المعنوي) للصورة المتمثل في مجموعة معاني تهدف الصورة إلى توصيلها . 


وما سبق يفيد احتياج محركات بحث الويب. ذات النظم الآلية في 
التكشيف. إلى نص اكثر اهتمامًا بمحتوى الصورة وابعاد المحتوى الثلاثة. مما 
يحقق للاشتقاق في التكشيف الآلى الكفاية في استخراج الكلمات المفتاحية لمحتوى 
الصورة متعددة الأبعاد. وقد جاء اقتراح إشراك المستفيدين في إحدى مراحل 
تكشيف الصور الرقمية مع إدخال التعديلات النهائية من العنصر البشري أمرًا 
طبيعيًا في ظل عدم توافر الوصف الكامل لمختلف محتويات وسيط المعلومات 
المرئي الثابت (الصورة) . ويعتمد اختيار الكلمات المفتاحية في البعد الثالث 
لمحتوى الصورة على الكلمات الأكثر تكرارًا في التعبير عن معاني صورة محددة, 
وبذلك يمكن إصباغ تكشيف البعد الثالث لمحتوى الصورة بصبغة التوافق والاطراد 
بين المستفيدين في عمليتي التنظيم والاستدعاء. حيث يعد البعد الثالث أكثر أوجه 
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الصورة عرضة لاختلاف آراء المستفيدين مع الأخذ في الاعتبار ثقافة المجتمع 
وخلفيته في التعبير عن محتوى هذه الصور. 


5 إجراءات تكشيف ملفات وصفحات صور الويب 


يقوم محرك البحث المقترح على أسس تتعدى الأداء العام لمحركات بحث 
sug!‏ نظرًا لاعتماد هذا المحرك على مراحل مختلفة لتكشيف الصور الرقمية 
يمثلها أولا البرنامج الآلي ثم العنصر البشري من جانب المكشف والمستفيدين. 
وتحاول الكثير من خدمات المعلومات على الويب (محركات البحث) الجمع بين 
مميزات عمل محرك البحث مع ادلة البحث لتحقيق فدر اكبر من التحقيق 
للمستفيدين؛ ومثال على ذلك ما عمل عليه دليل البحث Yahoo‏ بالجمع بين البحث 
الحر للكلمات المفتاحية والإضافة الآلية لقاعدة البيانات مع استخدام الإنسان في 
تكشيف المواقع لإقامة دليل الموضوعات العامة. وقد ساد لون أدلة البحث الشكل 
العام للبحث داخل Yahoo‏ وعلى الجائب الآخر فإن محركات بحث مثل Google‏ 
عملت على إدخال خدمة دليل البحث ضمن ما تقدمه من خدمات لاستدعاء 
معلومات الويب مما يعني الكفاية في تنوع خدمات استدعاء المعلومات داخل 
محركات وأدلة البحث. ويرى الباحث أنه يمكن تشكيل مراحل تكشيف الصور 
الرقمية داخل محرك البحث المقترح اعتمادًا على إشراك العنصر البشري إلى 
جانب برنامج المكشف الآلي كما يلي:- 


أولا: يتم تحليل كلمات النص الرقمي في بنية صفحات لفة الترميز 
المعيارية بواسطة برنامج المكشف لاستخراج الكلمات الأكثر دلالة بحسب أهمية 
alge‏ تلك الكلمات في الصفحات المصدرية للصور. بينما يمكن تعديل تعليمات 
عمل برتامج المكفف للحضول على Jas‏ بدلا مين الكلمات إذا Le‏ تم الاعتماذ على 
النص الشارح لوصف محتوى الصور الرفمية بدلا من الواصفات المفردة والمركبة. 
ويمكن الاستعانة هنا بما جاء في مقال search engines - submissions advice‏ لتكشيف 
محركات بحث الويب. حيث أورد المقال احتياج محركات البحث إلى الاهتمام 
بمجموعة من حقول بناء صفحات الويب مثل «title».....«/title» tag‏ وهو حمل 
العثوان الذي يحوي مجموعة الكلمات المفتاحية على موضوع صفحات الويب» ويمكن 
باستخدام ملفات الصور الرقمية المقترحة توجيه برنامج المكشف إلى العمل على 
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مثل هذه الحقول إلى جانب بعض الحقول المهمة في إخراج الكلمات المفتاحية مثل 
keywords meta tag‏ الجامع لمصطلحات مصممي صفحات ال 
والجدير بالذكر أن هذا المقال يشير إلى بعض المشكلات المحتملة فى 
تكشيف صفحات الويب» منها:- ٠‏ 
.١‏ تواجه صفحات الويب فترات انتظار طويلة فى تكشيف متون تلك الصفحات. 
وذلك يرجع إلى الأعداد المليونية التي يستقبلها المكشف يوميا. 
Y‏ إن النصوص التي تحويها صفحات الويب في شكل شعارات أو أشكال مصورة 
لا يتم تكشيفها مع نص اللغة المعيارية. 
Y‏ قد يتطلب تكشيف بعض صفحات الويب التعرف إلى كلمات المرور الخاصة 
بها. 
-t‏ إن العلامات المختلفة التي توجد في مسارات الويب مث 5 | لا يتم تكشيفها. 
0. قد لا يتم تكشيف الصفحات التي تأخذ وقتا أطول في التحميل» وهو الجانب 
المحتمل في صفحات عرض الصور الكثيرة. 
1. قد يلجأ بعض مصممي صفحات الويب إلى التحايل على برنامج التكشيف 
لتسجيل كلمات لا تتعلق بمحتوى صفحة الويب الرئيس. 
۷. إن الصفحات التي لا ترتبط مباشرة بالصفحة الرئيسة قد لا يتم تكشيفها. 
ويرى الباحث أن مشكلات التكشيف السابقة يجب أن تؤخذ في الاعتبار عند 
بناء ملفات الصور الرقمية باستخدام أحد المعايير مثل دبلن كور. EA‏ ثم تفادي 
عوائق التعامل مع تكشيف بينات تلك الصور الرقمية داخل ملفاتها. 
ثانيًا: إتاحة مجموعات الصور الرقمية حديثة الإضافة بالشكل التفاعلى 
أمام المستفيدين لإبداء المصطلحات أو العبارات المعبرة عن محتوى الصور 
الرقمية. على أن يكون ذلك فى جزء خاص داخل قاعدة البيانات الكبرى لمحرك 
البحث مع مراعاة إتاحة تلك eee‏ من الصور داخل قاعة البحث الرئيسة 
لمحرك بحث الصور. 


search engines - submissions advice. w.p., 2003,visited at 21/6/2003, URL ©) 
http://alt.venus.co.uk/weed/search/advice.htm 
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LIL‏ إدخال التعديلات النهائية من خلال العنصر البشري المتمثلة في 
تحديد الكلمات المفتاحية الأكثر تكرارا لمجموعات الصور أمام المستفيدين 
والتعديل في الصياغة النهائية لجمل أو عبارات وصف المحتوى. 


ويمكن الاعتماد هنا على ما ذكرته Axandra newsletter‏ حول بعض الملامح 
أكثر جدوى مع برامج الزاحف والمكشف في محركات البحث بصفة عامة؛ إلا أن 
الباحث قد عمل على تنقيحها بما يتوافق مع بيئة اللفة العربية: وهي mi SGN‏ 


.١‏ استخدام حقل «IMGSRC = "..."< tag‏ بدلا من تصميم الصورة بملامح لغة 
الجافا JavaScript‏ وذلك لما يتصف به برنامج الزاحف في التعامل مع هذه 
الحقول وتفقد صفحة الويب من خلالها. على أن تستخدم محارف اللفة 
العربية لدعم الكلمات المفتاحية في متن ملف الصورة الرقمية. 

Y‏ استخدام الحقول النصية AIT IMG‏ في التهبير عن محتوى الصور الرقمية داخل 
صفحات الويب من خلال وصف موجزء وذلك إذا احتاجت الصور إلى تقنيات 
مساعدة للعرض Jald‏ متصفح الويب fie‏ برامج screen readers‏ ويفضل هنا 
استخدام الكلمات المفتاحية والواصفات المحددة للتعبير عن الصور. 
وبالاعتماد على ذلك. فإنه يمكن صياغة حقول ملفات الصور المنشأة في بيئة 
اللفة العربية الرقمية بالواصفات المفتاحية على محتوى الصورة الرقمية. حتى 
oly‏ فارفت الصورة الرفمية نص صفحة الويب التابعة لها . 

dic داخل ملفات الصورة» وهو ما يعبر‎ <IMGTITLE> استخدام خاصية العنوان‎ Y 
بالرسالة التي تظهر أمام المستخدم إذا ما وقف مؤشر الأوامر على الصورة.‎ 
Apa) squall cile Alae cale. tal s Le gag 

-t‏ تهيئة اسم ملف الصورة Image FileName‏ لدعم برامج الزاحف؛ فبدلا من 
تسمية ملف الصورة ب summer.gif‏ فيمكن استخدام water-beach.gif‏ ويذلك 
يمكن التعامل مع مصطلحات اكثر دلالة. هذا فضلا عن تمييز مسارات الويب 
بالأدلة مثل water-beach/tourism/people.gif‏ مما يفيد في التعرف بشكل أفضل 


WEEKLY SEARCH ENGINE FACTS. The Axandra newsletter archive, 2003, visited at (1) 
1/10/2003,: http://www.axandra.com/news/index.htm 
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إلى الصورة الرقمية. ويقترح الباحث أن يتضمن حقل العنوان في ملف 
الصورة الرقمية تعريب مجموعة الكلمات التي وردت في مسار أو عنوان 
الصورة على الويب. حتى إذا ما أصاب برنامج المكشف هذه الصورة اتضحت 
الكلمات الأكثر دلالة على المحتوى. 

۵. الاهتمام بالنصوص المحيطة بالصورة ؛ حيث تستخدم الكثير من محركات 
الصور النصوص المحيطة بملف الصورة لاشتقاق الكلمات المفتاحية وهي 
الأقرب إلى الصحة. وذلك يأتي بتبني معيار ثابت لبناء ملفات الصور 
الرقمية. على أنه يمكن لملفات الصور الرقمية العربية أخذ المبادرة في بث 
تلك الملفات المعيارية إلى فضاء الويب مع تخصيص الدعم الآلي اللازم 
لبحث ووصف اللغة العربية. 

.1١‏ استخدام عنوان صفحة الويب؛ بحيث يمكن الاستفادة من عناوين صفحات 
الويب إذا ما اتصلت الصور الرقمية مباشرة بموضوع الصفحة لاشتقاق 
الكلمات المفتاحية. 

۷. الاهتمام بالروابط بين صفحة الويب والصفحات الأخرى بحيث يتم تحليلها 
للتعرف إلى الكلمات المهمة فى التعبير عن ملفات الصور الرقمية. 


75 لغات التعبير عن المحتوى والموضوع 

يطلق مصطلح اللغة داخل التحليل الموضوعي لوسائط المعلومات على نظم 
صياغة الواصفات الموضوعية. وتنقسم هذه اللغة إلى لغة طبيعية في حالة عدم 
استخدام أدوات تقنين أو لغة مقيدة مضبوطة متمثلة في قوائم رؤوس موضوعات 
dele‏ أو متخصصة (المكانز) . وتبعًا لاختلاف الشكل بين النص والصورة. فإن 
الصور الفوتوغرافية تحتاج إلى استخدام اللفة الطبيعية نظرًا لاختلاف وسط حمل 
المعلومات أيضًا. وتحتاج الصور الفوتوغرافية العامة دون العلمية أو الإعلامية إلى 
استخدام اللغة الطبيعية في وصف محتوى صور الويب. ويعود ذلك إلى عاملين هما؛ 
الأول أن محركات بحث الصور تعتمد في تكشيفها على النص الكامل لملف الصورة 
الرقمية. أو الصفحة المصدرية لاشتقاق الواصفات الموضوعية للصور الرقمية. Lal‏ 
العامل الثاني فهو تميز الصور الفوتوغرافية العامة دون العلمية بوجود البعد الثالث 
لتحليل محتوى الصورة الذي لا يكاد يوجد في الصور العلمية التي تصور ظواهر 
طبيعية أو تكنولوجية وهي ما تسمى بالعلوم الصلبة Hard Sciences‏ التي تتميز 
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بالحصر والتحكم. وهو ما يجعل الصورة العلمية لا تعتمد على أي بعد غير الأبعاد 
المرئية. في حين أن البعد الثالث قد يتوارى داخل الصور الإعلامية خلف الأحداث 
السياسية والإعلامية... وغيرها. 

وعلى ذلك فإن الصور الرقمية العامة تعتمد على النوع الثاني من لفات 
التكشيف وهي اللغة الطبيعيةء ويأتي مصطلح لفات التعبير كتوضيح لأقسام ثلاثة 
داخل اللغة الطبيعية الحرة هي التكشيف باستخدام المصطلحات المفردة أو 
العبارات الواصفة أو الجمل والشارحة لمحتوى الصورة الرقمية؛ وهو ما يتمثل في 
النص الكامل لجمل وعبارات صفحات الويب المشتملة على الصور الرقمية موضع 
البحث داخل محركات بحث الصور. وتعد الجمل الشارحة أكثر لفات التعبير عن 
محتوى الصور استخدامًا Jota‏ محركات بحث الصور نظرًا لما يقوم به محرك 
البحث من استدعاء الصور اعتمادًا على كل كلمات نص صفحة الويب. ويرى 
الباحث أن الصور الرقمية العامة تحتاج إلى أعداد كبيرة من المصطلحات المفردة 
للتعبير عن عناصر المحتوى الداخلي للصور العامة بأبعاده الثلاثة إذا ما تم 
الاعتماد على الواصفات الموضوعية. وتمر عملية التكشيف المقترحة لصور الويب 
داخل محركات بحث الصور بثلاث مراحل تبدأ بعمل برنامج المكشف داخل محرك 
البحث وتنتهي بالتعديل الإنساني بعد استخدام واصفات مستخدمي محرك البحث 
المقترحة لتكشيف الصورء ومن شان تعدد مراحل التكشيف أن يخلف الكثير من 
المصطلحات المفردة والمركبة المعبرة عن محتوى صور الويب. ويوضح العنصر 
التالي أهمية الحديث عن اللغة العربية بعد الحديث عن اختيار اللغة الطبيعية 
لوصف الصور الرفمية. 
5 الاعتماد على معجم آلي للغة العربية 

تتميز اللفة العربية بالكثير من الصفات fie‏ الاشتقاق والترادف والاشتراك 
اللفظي... cadi‏ وكانت تلك الصفات هي ذاتها المشكلات الرئيسة في تحقيق كفاية 
نظم استرجاع المعلومات باللغة العربية. وقد أورد Badr H. al-Badr‏ المشكلات الرئيسة 


y 
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AL-BADR, Badr H. Using the Internet in Arabic: Problems and Solutions, (*) 
King Abdul aziz City for Science and Technology, [2002?], visited 22/11/2002,: 
http://www.isoc.org/inet98/proceedings/5f/5f 1.htm 
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تبنى اللغة العربية على اشتقاق الأشكال المختلفة للكلمات من الجذور. مما 
يجعل الاتجاه في معالجة مصادر الويب العربية يعتمد على التحليل الصرفي 
لجذور الكلمات. 


تعتمد معالجة dal!‏ الطبيعية على قوائم التوقف للكلمات غير الدالة. وتتمثل 
هذه الكلمات في اللفة الإنجليزية في الفاظ مثل Lal .with, for‏ في اللغة 
العربية. فإنها تحتوي على اللواصق واللواحق الملتصقة بالكلمات الدالة. علاوة 
على بعض اللواحق مثل الضمائر. 


الأخرى. مما يسبب صعوبة في تحليل هذه الكلمات وكتابتها بأشكال مختلفة 
وهو الأمر الذي يؤثر على كفاية الاستدعاء والتحقيق. 


ونتيجة لأعداد مواقع الويب العربية الآخذة في الزيادةء فقد تناولت بعض 
محركات الويب مثل الإدريسي الذي تنتجه شركة صخر وشركة IBM‏ مشكلات 
الاسترجاع في اللغة العربية للتعامل مع العدد المتزايد من صفحات الويب 
العربية. ويتركز الحديث هنا حول الاعتماد المقترح لاستخدام المعاجم الآلية 
في مرحلة التنظيم ( التكشيف) التي Lan‏ باشتقاق الواصفات الموضوعية 
لصفحات الويب. وتعد المعاجم الآلية العمود الفقري لتنظيم واسترجاع 
المعلومات العربية حيث يتوفر بذلك إجراءات التنظيم في تحليل الأشكال 
المختلفة للكلمة الواحدة. ومن ثم يمكن التدقيق في حساب تكرار الكلمة إذا 
ما اعتمد محرك البحث على اشتقاق الكلمات المفتاحية بحسب تكرارها في 
صفحة الويب. أما إجراءات الاستدعاء فهي تتمثل في تحليل كلمات البحث 
المستخدمة من جانب المستفيد لاستدعاء صفحات الويب» مما يساعد على 
أداء خدمات الاسترجاع في اللفة العربية fia‏ استدعاء المقابلات أو استدعاء 
الوحدات التي تحتوي على معنى كلمة البحث أو جذر كلمة البحث بمختلف 
السوابق واللواحق. وهو ما يتناوله الحديث في التعرف إلى التحليل الصرفي 
للغة العربية. ويحتاج محرك بحث الصور باللغة العربية إلى أحد المعاجم 
الآلية للتحكم في مفردات اللغة. على أن يتسم هذا المعجم بتعدد LL‏ 
المقابلة للغة العربية. 
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5 تكوين قواعد بياتات محرك البحث الداخلية 


تأخذ البيانات الخام داخل نظم استرجاع المعلومات مجموعة من الخطوات 
حتى تصل إلى الشكل المسترجع من نظام المعلومات. وتتمثل البيانات الخام في 
نظم استرجاع الصور في ملفات الصور وصفحات الويب المصدرية لهذه الصور, 
وتختلف أوجه التعامل مع هذه الصفحات بحسب مرحلة الإعداد الفني ومما يحتاج 
معه من توفير قواعد بيانات مختلفة لتخزين الشكل الواحد لكل صفحات الصور 
داخل نظام المعلومات. ويحتاج برنامج المكشف إلى قاعدة بيانات لتخزين 
مجموعات النسخ المضافة بواسطة الزاحف لتحليل وتكوين ملفات قاعدة فهرس 
محرك البحث. وتدخل الصور في مرحلة أخرى هي التفاعل مع مستخدمي محرك 
بحث الصور لتلقى مجموعة الواصفات الموضوعية المعبرة عن اراء مختلفة تجاه 
البعد الثالث للصور الرقمية. 


ويوضح نظام Al-Kharashi‏ في الشكل رقم (5-1) أنواع ملفات قاعدة بيانات 
محرك البحث المتنوعة بين ملفات البحث داخل التقسيم الموضوعي (الدليل). أو 
تلك التي تحتوي على المجموعات المكشفة من صفحات الويب إلى جانب تخزين 
نسخ هذه الصفحات. وعلى ذلك فإن محرك بحث الصور الرقمية يحتاج إلى انواع 
مختلفة من الملفات التي تتيح معالجة الصور في مراحل مختلفة أو ملفات البحث 
أمام المستفيدين. وقد تتكامل مجموعة من قواعد البيانات تكون المجموعات 
الكاملة لمحرك البحث. وتأتي الحاجة إلى مجموعة الملفات السابقة بأنواعها نتيجة 
لطول فترة المعالجة الفنية لصفحات الويب داخل محركات البحث حتى يمكن 
للمستفيدين الحصول على صفحة الويب كإحدى وحدات نتائج البحث داخل 
المحرك. وتختلف هذه الفترة بين محرك بحث وآخر. فقد تصل هذه الفترة إلى 
ثلاثة اشهر داخل محرك البحث Yahoo‏ نظرًا لاستقباله مليون صفحة ويب يوميا يتم 
إضافتها إلى قاعدة Saal‏ . 


Frequently Asked Questions. Web Drive Canada Inc., 2001, visited 30/1/2003, (1) 
http://www.webdrive.ca/faq.html 
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مؤشر لطبيعة نص الحقل م کلمات مباشرة تسجيلات - 
النصوص شافات 


الشكل رقم (5- (Y‏ يوضح مراحل عمل محرك البحث المقترح 


5 إعداد واجهة صفحة التسجيلة النهائية 
5 شكل التسجيلة النهائية 

تنتهي عملية الإعداد الفني بشقيها الوصف المادي والوصف الموضوعي 
بتكوين شكل تسجيلة الوصف الببليوجرافي الكاملة, وتضم هذه التسجيلة ضمن 
حقولها الواصفات الموضوعية بجانب الوصف الموضوعي الشارح لموضوع الصورة 
إذا ما تم استخدام العبارات أو الجمل لتحليل المحتوى. ويختص هذا الجزء 
بالشكل العام لصفحة التسجيلة النهائية وما يمكن أن تحويه هذه الصفحة بجانب 
عناصر الوصف الببليوجرافي من واصفات موضوعية إلى عرض الصورة الرقمية 
بالحجم الملائم داخل التسجيلة. وتنقسم العناصر المكونة للصفحة النهائية إلى 
حقول واصفة لمحتوى وشكل الصورة وإطار عرض الصورة الرفمية بجانب الخدمات 
المقدمة لمستخدمي محرك البحث للتعامل مع الصورة المحددة من الوحدات 
المستدعاة. 
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ويقترح الباحث تقديم التسجيلة النهائية كاملة الحقول بجانب إطار الصورة 
الرقمية في القسم الأعلى من صفحة التسجيلة النهائية على أن توضع الخدمات 
الممكنة للتعامل مع الصورة في شكل رموز تعبر عن هذه الخدمات مثل شكل v‏ 
الدال على تنزيل الصورة و3015ماء إذا لم تخضع هذه الصور بطبيعتها لحقوق 
النشر. أما القسم الثاني من صفحة التسجيلة النهائية فيمكن أن يحتوي على 
النسخة الكاملة للصفحة المصدرية للصورة الرقمية موضع الاختيار. حيث يحتاج 
بعض المستفيدين إلى التعرف إلى محتوى الصورة في الإطار العام لمحتوى صفحة 
الويب مما يساعد على فهم الموضوع أكثر. ويفصل بين قسمي الصفحة إطار يسمح 
بالتحرك خلال أي من القسمين العلوي أو استعراض صفحة الويب فقط. 

وتتعامل نظم الاسترجاع مع التسجيلات الببليوجرافية بثلاثة مستويات 
للعرض أمام المستفيدين. وهي تختلف بين المستوى المختصر والكامل والفني؛ 
حيث يتضمن المستوى المختصر الحقول المهمة في التعريف بوسيط laglea)!‏ 
ويتضمن المسنوى الكامل الحقول الكاملة؛ ويزيد على حقول الوصف بيانات أخرى 
مثل اسم المدخل أو تاريخ الإدخال ويشتمل عليها المستوى الفني في العرض. وهذا 
يعني أن خيار مستوى العرض يمكن التحكم فيه مع وقف التعديلات لمختلف هذه 
المستويات. ويأخذ إطار الصورة في حجم متوسط Laga‏ موازيًا لحقول الوصف على 
أن تكون هذه الصورة رابطًا للحجم الكامل للصورة بدون بيانات مصاحبة ويمكن 
استخدام حقول الوصف الاأخرى كروابط استرجاعية للبيانات المعبرة fie lgie‏ اسم 
المصور او تاريخ الصور أو الكلمات المفتاحية Jodo Jla‏ الوصف الموضوعي. 
5 أنواع الخدمات المقدمة تجاه التعامل مع الصورة 

تختلف أنواع الخدمات المقدمة بين محركات البحث تجاه الصور الرقمية 
حسب طبيعة محركات البحث التجارية المتخصصة أو محركات البحث العامة. 
فتقدم محركات البحث مثل Corbis‏ خدمات مثل طلب شراء الصورة أو التعرف إلى 
حقوق النشر أو إرسالها كبطافة مراسلة او تحميل الصورة على منفذ المستفيد . 


5 مراحل عمل محرك الصور 


يظهر الشكل رقم )1 - (Y‏ الذي قدمه Al-Kharashi‏ الإجراءات الآلية لعمل 
محركات البحث العامة سواء تلك العامة فى أشكال المعلومات أو العامة فى 
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نوک عات Sigs es‏ أن Sieh, aise a‏ السابق jai usd Soil aa‏ 
برنامج الزاحف الخاص بإجراءات الإضافة وهو الرابط بين البيانات الخام 
الداخلة إلى قاعدة بيانات المحرك وإفراغ بيانات الموقع المضافة داخل الشكل 
الببليوجرافي المعد من خلال برنامج المكشف. وهذا يأتي في إطار تركيز الشكل 
السابق على تحليل البنية الداخلية لمحرك البحث دون التأكيد على الإجراءات 
التي تحملها الأسهم في انتقالها من مكون إلى آخر داخل بنية محرك البحث. 
وعمل مخطط Al-Kharashi‏ على إظهار تقسيم فاعدة محرك البحث إلى فواعد 
ثلاث يختلف شكل البحث داخلها باختلاف شكل البيانات الببليوجرافية وطبيعة 

الحقول النشطة في البحث أمام المستفيد. 


وقد استخلص الباحث المراحل الإجرائية التالية لعمل محرك البحث 
لإصباغها بصبغة افتناء ومعالجة وبحث وسيط الصور الفوتوغرافية الرقمية. وهو ما 
يلي بدوره التركيز على معالجة وسيط معلومات الصور الرقمية على الويب. وكأنت 
المراحل كالتالي:- 
5 مرحلة عمل برنامج الزاحف أو العنكيوت 

يؤدي برنامج الزاحف في نظام استرجاع الصور دور متخصصي التزويد في 
أعمال الإضافة والانتقاء. ويتحرك برنامج الزاحف أو العنكبوت متبعًا لأوامر وسياسة 
محددة في التعامل مع مصادر الصفحات. ويؤدي برنامج المنكبوت كل مهام 
التزويد من حيث إضافة المصادر والمجموعات الحديثة ومتابعة حالة المجموعات 
الحالية من إحلال وتجديد لكل التالف والمفقود؛ ويتمثل هذا العمل داخل محركات 
البحث في الزيارات الدورية التي يقوم بها برنامج الزاحف داخل كل روابط قاعدة 
البيانات للتعرف إلى الروابط المكسورة broken links‏ أو التحديثات التي مرت بها 
صفحات الويب سابقة الانضمام لمحرك البحث. ويعتمد برنامج الزاحف في 
الوصول إلى موافع وصفحات الويب وضمها إلى فاعدة البيانات يعتمد على طبيعة 
شبكة الويب. حيث يمكن نظريًا زيارة كل صفحات الويب متخدًا من روابط 
الصفحات وتداخل هذه الروابط مسارًا واحدًا يمر بكل المواقع والصفحات المنتمية 
للويب» ويتضح ذلك أكثر في تحليل برنامج الزاحف لكل الروابط التي يجدها في 
صفحة واحدة تم ضمها إلى قاعدة البيانات. ولعل هذه المهمة تسير ذاتيا اعتمادًا 
على تعليمات سابقة لبرنامج الزاحف. ويفسر عمل برنامج العنكبوت الأعداد الكبيرة 
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التي يتم إضافتها Legs‏ إلى قاعدة بيانات محرك البحث. والذي calix,‏ هنا عن 
أدلة البحث القائمة على استخدام العنصر البشري في إضافة وتحديث المجموعات 
S OX vost "S‏ 

في فواعد بياناتها . 


ويوضح العرض السابق مدى التأثير الذي يحدثه برنامج الزاحف في سمات 
مجموعات محرك الصور إذا ما تم تزويد هذا البرنامج بخصائص محددة مثل 
فوائم التوقف عن الصور التي لا تناسب طبيعة محددة للاستخدام. ويلتزم برنامج 
العنكبوت بأداء إجراءات الركن الأول من أركان ثلاثة لعمل محرك بحث الصورء. 
يليها الإعداد الفني للصور ثم الاستدعاء بحسب الحاجة الموضوعية. ويمكن تقسيم 
المواصفات المقترحة لمهام برنامج الزاحف اختصاصي التزويد في ثلاثة عناصر 
كما يلى :- 


5 خصائص البحث والتحديث 


يقترح الباحث تزويد برنامح الزاحف بمجموعة من التعليمات تمثل سياسة 
الإضافة والاقتناء. ومن التعليمات؛ ان يجيد برنامج الزاحف التعرف إلى ملفات 
الصور الرقمية الفوتوغرافية فقط» خلاف ما يكون عليه مصطلح Image‏ من اتساع 
يشمل اللوحات الفنية والأشكال البيانية... وغيرها من وسائط المعلومات المرئية 
الثابتة. وهذا ما Jam‏ مجموعات قاعدة البيانات أكثر إفادة في مرحلة الاستدعاء 
واسترجاع الصور؛ فمن الطبيعي أن البحث يمكن أن يستدعي معه كل مصادر 
المعلومات عن موضوع محدد؛ إلا أن طبيعة هذه المصادر وشكل المعالجة لا يعطي 
الدرجة المطلوبة من التحقيق لهذا الموضوع. وقد يمتد الأمر هنا إلى الاعتماد على 
تحليل المحتوى Content Retrieval‏ لمساعدة برنامج الزاحف في تحقيق فائدة 
التزويد. وتشمل سمات التزويد أيضًا التعامل مع ملفات الصورة أو ال الصفحات 
المصدرية التي تحوي هذه الصورء ويرجع التعامل مع الصفحات المصدرية فقط 
إلى التحليل الموضوعي للصور الفوتوغرافية الرقمية الذي يعتمد في afno‏ الويب على 
اشتقاق نقاط الاسترجاع من داخل متن صفحات الويب الحاوية لملفات الصور 
الرقمية. ويأتي المحور الثاني من عمل الزاحف متمثلا في سمات التحديث وإعادة 


How Search Engines Work. Search Engine Watch, 2002, visited at 18/4/2003, (1) 
http://www.searchenginewatch.com/webmasters/article.php/2168031 
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الزيارة للصفحات السابق إضافتهاء ويأتي ذلك ضمن الهدف من متابعة التحديثات 
والإضافات لهذه الصفحات. وتختلف طبيعة الصور عن المواد النصية في التحديث؛ 
حيث يتمثل تحديث النصوص في إضافة أو حذف فقرات أو أجزاء من النص 
الأصلي. وهو ما لا يحدث مع الصور التي يكون التحديث فيها على مستوى الوسيط 
بإضافة أو حذف صور بأكملهاء ولا تكون بتغيير شكل الصورة في العناصر المرئية. 
والتحديث لقاعدة الصور هو المعنى الآخر لكلمة الإضافة؛ حيث يكون التحديث لكل 
مجموعات الصور الرقمية. 


التفاعل بين برنامج الزحف و ملفات الصور 
الرقمية على الويب 


الشكل رقم (5- 4) 
يوضح مراحل التعامل بين الزاحف وصفحات ملفات ai‏ 


يوضح الشكل رقم )£71( أن برنامج الزاحف ينطلق في عمله مع الإضافة 
من خلال الروابط القائمة بين صفحات الويب وبعضها البعض» وهو الأمر الذي 
يجعل من اليسير على برنامج الزاحف الإبحار في الأمواج المتزايدة من صفحات 


Smith, John R. & Chang, Shih-Fu. Searching for Images and Videos on the World- (1) 
Wide Web, Department of Electrical Engineering and Center for Image Technology 

for New Media, Columbia University, New York, 1996, visited at 12/12/2002, 
http://www.dlib.org/dlib/february97/columbia/O2chang.html 
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الويب. ومع الأخذ في الاعتبار عدم وجود الروابط بين ملفات الصور الرقمية أو 
روابط الصورء فإن برنامج الزاحف على ذلك لا يستطيع الوصول إلى ملف صور أو 
صورة رقمية من صورة أخرى. وإنما daaa‏ من خلال صفحة أخرى. وذلك ما Gal‏ 
إلى استخدام مراحل ثلاث لوصول برنامج الزاحف إلى ملفات الصور ذاتها. وعلى 
الرغم من أن صفحات الويب هنا ليست الهدف من الإضافة؛ إلا أنه لا يمكن دعم 
برنامج الزاحف بخاصية إضافة ملفات الصور مباشرة. وهذا يرجع إلى الدور 
الأساس الذي يقوم به متن صفحة الويب في التكشيف بالاشتقاق للصور الرقمية 
التي تحويها تلك الصفحات. ويرى الباحث baie!‏ على ما سبق من أهمية صفحات 
الويب» أنه يمكن التعامل مع صفحات الويب في مرحلة الإضافة الأولى ثم التعرف 
إلى روابط الصور الرقمية في تلك الصفحات في المرحلة الثانيةء وتكون المرحلة 
الثالثة بإخراج الصور الرقمية إلى قاعدة بيانات الصور. ويمكن الاستعانة بالجدول 
(LIU‏ الموضح لنهايات مسارات محددة يعمل عليها daaa‏ برنامج الزاحف» مما 
يمكن معه التأكيد على نوع بعينه من ملفات الويب. وذلك كما يلي :- 


الجدول رقم )3*- )١‏ 
يوضح نهايات العمل لبرنامج الزاحف 


Extension | Type 
.gif | Compuserve image format 
| jpg, jpeg, pe, .jfif,.pjpeg,.pip | JPEG image format 
| .qt,.mov,.moov | Quicktime video format 
.mpeg,.mpg,.mpr,.mpv,.vbs,.mpegv MPEG video format R4 3 
.avi | Microsoft video format 
| .htm,.html Hypertext Markup Language 


5 /قائمة توقف عن الصور 

يقترح الباحث أن يعتمد برنامج الزاحف على قائمة توقف يمتنع بها عن 
تلك الصور غير الملائمة لطبيعة مستخدمي الصور. ويأتي ذلك اعتمادًا على 
مجموعة من التعليمات التي يسير عليها الزاحف في التقاط الصورء وهو ما يتضمن 
سياسة الترشيح لوسائط المعلومات ليس daza‏ في الاستدعاء. وإنما عند الإضافة 
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أيضاء هذا ليحقق محرك الصور القدر الأكبر من التحكم في أوعيته من الصور. 
وتعطى تعليمات التوقف لبرنامج الزاحف عن صور محددة عندما يحتوي مسار أو 
عنوان هذه الصور على بعض الكلمات المطابقة لكلمات داخل قائمة التوقف 
المصاحبة لبرنامج الإضافة. 


5 نسخ صفحات الويب 


Y‏ يتوقف عمل الزاحف عند الوصول إلى صفحات وصور الويب. وإنما يتعدى 
ذلك إلى تغذية قاعدة بيانات المكشف بكامل شكل صفحة الويب» مما يعني نسخ 
هذه الصفحة. يهدف الزاحف من خلال نسخ صفحات الويب إلى تحليل مختلف 
الروابط links‏ والمسارات URLs‏ داخلهاء ومن ثم يستطيع الزاحف الوصول إلى 
صفحات جديدة وموضوعات أخرى. أما الهدف الآخر من عملية النسخ فيتمثل في 
توفير كامل النص لبرنامج المكشف وإخراج الأشكال المختلفة من وسائط حمل 
المعلومات النص. الصوت. الصورة . هذا إذا ما كان محرك البحث يدعم 
البحث في أشكال مختلفة من الوسائط . 


تعتمد بعض المحركات على وضع صفحة الويب كأحد العناصر المكونة للتسجيلة 
الببليوجرافية. في حين أنه يتم حذفها في بعض المحركات التي تستخدم النسخ 
daza‏ لعملية الإعداد الفني ثم يتم حذف النسخ مرة أخرى. وتواجه محركات الصور 
الرقمية عائق حق النشر في التعامل مع نسخ الصور وهو ما تتصف به الملابين من 
الصور الرقمية على الويب؛ إلا أن الوصول إلى الشكل الكامل للصور الرقمية يمكن 
أن يكون في صفحتها المصدرية. وتعوض اللقطات Thumbnails‏ ذلك في بناء 
التسجيلات الببليوجرافية. 


5 معوقات وحلول عمل برنامج الزاحف 

إن اعتماد محركات البحث على سياسات مختلفة في التعامل مع صفحات 
الويب إضافة ومعالجة dias‏ جعل الكثير من المعوقات تكتنف عمل برامج 
الزاحف في التعامل مع صفحات الويب. وقد آثر الباحث إدراج هذه المعوقات في 
هذا الجزء من الدراسة للاعتناء بالحلول المقترحة في بناء برامج الزاحف. وقد 
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أشار Ray Denenberg‏ إلى هذه المعوقات موضحًا بعض المقترحات التي يمكن 


التعامل بها. وهي كما يلي 


(Y) 


0) 


إن الزاحف Y‏ يعتمد على مهيار coU‏ في عمق التكشيف لصفحات الويب. 
وذلك يمكن أن يرجع إلى قيمة صفحة الويب أو كثافة عدد الصفحات داخل 
موقع الويب أو حقوق الملكية التي تمنع الزاحف من التعامل مع متن صفحة 
الويب. هذا فضلا عن ارتكاب برامج الزاحف لخطأ إضافة الصفحات 
الاحتياطية mirrorsites‏ لموافع الويب» وتتسم هذه الصفحات بالبعد عن 
التحديث مما يترتب عليه تكدس قاعدة بيانات محرك البحث بإصابات خاطئة 
في عمليات البحث. 


إن اعتماد برامج الزاحف على استخدام الروابط للوصول إلى الصفحات يجعل 
هذه البرامج تعمد إلى إدخال أنواع من المعلومات التي لا يمكن تكشيفها داخل 
محرك البحث fie‏ ملفات الصوت والصورة التي يصعب على بعض محركات 
البحث التعامل معها. 
تعمل برامج الزاحف دون النظر إلى أهمية صفحات الويب التي يتم إضافتها 
إلى فاعدة بيانات المحرك» ذلك لما تفقده هذه البرامج من المهارة في تقييم 
المعلومات داخل صفحات الويب. 
تواجه برامج الزاحف مشكلة أخرى تتعلق باستتار المعلومات داخل الويب بعيدًا 
عن ايدي المستفيدين»و ذلك يرجع إلى عدم إتاحة المعلومات داخل الخادمات 
التي تحملها نظرًا لمنع Ax BY!‏ لمصادرهاء نزولا عن المدة الزمنية التي تمر 
بها صفحات الويب منذ بداية تحميلها على الويب إلى تعرف الزاحف عليها 
وتكشيفها داخل محرك البحث. 

الحلول المطروحة :- 
إن الوقوف على الحلول الكافية للمشكلات السابقة يأتي من خلال التعاون بين 
القائمين على إعداد الكشافات ومنشئي مصادر المعلومات من المؤلفين 
والناشرين. ويأتي الحل الأول في شكل تجزئة العمل بين برامج الزاحف 


Denenberg, Ray. Structuring and Indexing the Internet, Library of Congress, 1996, 
visited 1/11/2003, http://Icweb.loc.gov/23950/agency/papers/italy.htrn! 


— YM — 


المختلفة. مما يؤدي بدوره إلى تحسين العمل في إضافة وتحليل مواقع الويب. 
على حين أن هذا الاقتراح يصعب تنفيذه من الناحية العملية لما يؤثر على 
الجوانب المادية وإدارة الأعمال لمحركات البحث. 

يتمثل الحل الثاني في تمكين محرك البحث ذاته من التعامل مع صفحات 
الويب القادمة من الزاحف بتحديد قيمة هذه الصفحات وتحديد اللائق 
للتكشيف منها والامتناع عن الأخرى: وهذا يمكن محرك البحث من التحكم 
في فيمة المعلومات المكشفة والتعرف إلى إحصائيات إدخال وبحث المعلومات 
داخل فاعدة البيانات. 


ويمكن طرح حل آخر وهو فيام منتجي مصادر المعلومات من مؤلفين وناشرين 
بإعداد حقول البيانات الخلفية التي ترفق مع صفحات الويب بما يمكن 
للمكشف التعامل مع محتوى صفحة الويب وتعرف برنامج الزاحف على 
ماهيتها؛ إلا أن ذلك يكتنفه بعض المعوقات مثل عدم توافر القدرات الكافية 
لدى الكثير من منتجي المعلومات على الويب لاعداد حقول البيانات الخلفيةث 
إضافة إلى تعارض الشكل الموحد لكتاب حقول البيانات مع السياسات 
المختلفة للتكشيف داخل محركات البحث؛ حيث توجد الكثير من الآليات التي 
تعمل بها محركات البحث مثل التكشيف بتاريخ إعداد صفحة الويب. تاريخ 
التحديث الأخير لها. وهي خلاف الآليات الأخرى غير المعروفة أو التي يتم 
البحث لتحديتها الآن. 


وأخيرًا يمكن القول بأن التعامل مع مشكلات برنامج الزاحف يمكن التعامل 


معها جذريا من خلال التوجه إلى معايير موحدة تخدم عمل محركات البحث 
المختلفة على الويب. وهو ما تحتاج محركات البحث للعمل به خلاف تبني سياسات 


5 مرحلة البحث في المحركات 


يتكامل نظام بحث الصور الرقمية مع نظامي الإضافة (التزويد) والإعداد 


الفني (المعالجة)؛ لتحقيق نظام متكامل لاسترجاع الصور الرقمية. ويستند نظام 
بحث الصور داخل محركات البحث العربية اعتمادًا على polic‏ فرعية مثل؛ آليات 
البحث الملائمة dal‏ العربيةء والمعاملات المكونة لآليات البحثء وأدوات معالجة 
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الاسترجاع سواء التصفح بالتقسيم الموضوعي أو استخدام البحث الحر بالكلمات 
المفتاحية. وتتناول الدراسة في العناصر التالية نظام بحث الصور الرقمية ذات 
النصوص العربية:- 

5 استخدام أسلوب التصفح 


تحتاج الصور الرقمية في استرجاع مجموعاتها إلى تقسيمات موضوعية أكثر 
دقة من تلك التي تخدم استرجاع النصوص؛ حيث تتميز الصور بالبعد الثالث 
للمحتوى (المعاني) مما يحتاج إلى دقة أكبر في ربط الصورة الرقمية بالمصطلح 
المحدد في قوائم المصطلحات الموضوعية. ويزداد الأمر أهمية عندما تكون لغة 
الاستدعاء هي اللغة العربية بوفرة مترادفاتها وتراكيبها المتداخلة مع المشتركات 
اللفظية... إلخ» وتحتاج الصور الرقمية إلى أداة مقننة يمكن أن تتمثل في قوائم 
رؤوس الموضوعات أو الكشاف النسبي التابع لخطة ديوي الحصرية؛ إلا أن الاعتماد 
هنا يكون على المصطلحات وليس الأرقام المقابلة لها. وتحتاج قواعد الصور 
الرقمية المتخصصة بطبيعتها إلى أدوات المكانز BUS‏ ما تتسم به قوائم رؤوس 
الموضوعات من حصر الموضوعات والمصطلحات rre,‏ 

ويستخدم أسلوب التصفح أكثر من شكل لعرض محتويات قاعدة بيانات 
محرك الصور من أشهرها الاعتماد على المصطلحات فقط للتعبير عن الموضوعات 
العامة والمتخصصة. أو أن يتم استخدام الصور كممثل لموضوعاتها ترمز كل وحدة 
منها إلى موضوع محدد عام أو خاص. ويقترح الباحث استخدام أداة حصر لرؤوس 
الموضوعات العامة في شكل الألفاظ على أن تتداعى هذه المصطلحات في قوائم 
وتقسيمات من العام إلى الخاص إلى الأكثر تخصصا. يمكن معها ترميز 
المجموعات الكاملة لقاعدة بيانات الصور الرقمية. وحري بالذكر أن أسلوب 
التصفح يعمل بقدر أعلى من الكفاية كلما تحددت مجموعات الصورء وهو ما لا 
تتسم به قواعد محركات الصور على الويب؛ نظرًا لاعتماد محركات البحث على 
برنامج الزاحف الآلي مما يمكن إضافة الملايين من ملفات الصور. وينتهي هذا 


Subject Tree Searches: Intro To Subject Trees.[with out publisher], 20037, visited (1) 
28/8/2003, http://www.concentric.net/^Rkriesel/Search/S-Trees.html 
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الأمر إلى تراكم مجموعات الصور الرقمية داخل محركات البحث يصل إلى مئات 
الملايين من ملفات gut!‏ وقد استخدمت مقالة C. Olivia Frost «http://‏ 
www.si.umich.edu/-cfrost/index.html» )‏ السايقة أداة ضبط المصطلحات (Art and‏ 
Architecture Thesaurus AAT‏ لتكشيف الصور الرقمية في قاعدة الفنون والعمارة. إلى 
جائب نظم تكشيف sx‏ مثل Library of Congress Thesaurus for Graphic Materials‏ 
LCTGM‏ أيضًا الأداة المتخصصة Thesaurus of Geographic Names TGN‏ لتمثيل صور 


C Lal adl الأشخاض فن‎ 


ويقترح الباحث الاعتماد على بناء هذه القوائم من طبيعة مجموعات الصور 
داخل فاعدة بيانات محرك الصور وذلك لما يمكن dae‏ توفير الجهد المستنفذ في 
تهذيب مصطلحات تلك القائمة المعدة مسبقًاء ويمكن بناء تلك القائمة من خلال 
أسلوب التعامل الآلي مع بناء المكانز ‘Thesaurus‏ حيث تعمل محركات البحث أثناء 
عملية التكشيف على اختيار أعلى المصطلحات دلالة داخل صفحة الويب ثم 
تضمينها في الترتيب الملاتم داخل قاتمة التصفح بإشراف العامل الإنساني داخل 
محرك البحث. على ان تكون تلك المصطلحات محدودة العدد بحيث لا يتعدى 
عددها للصورة الواحدة أكثر من مصطلحين أو ثلاثة. كما أن تحديث تلك القائمة 
يتم بشكل آلي ومساير لتطور المصطلحات المستخدمة مع الصور الفوتوغرافية 
العامة على الويب. 


يمكن أيضًا من خلال التعرف إلى مميزات وعيوب أسلوب التصفح الوصول 
إلى الشكل المرضي للمستفيدين لاستخدام هذا الأسلوب في محرك بحث الصور 
المقترح» ويمكن vint‏ على pem‏ التالي = 
مميزات أسلوب التصفح 
)١‏ يتميز أسلوب التصفح عن أسلوب الكلمات المفتاحية بتحقيق التفاعلية بين 
إشارات ترشده إلى الوقوف على ما يريده من معلومات و مساعدته في 
الوصول إليها. 


Frost, C. Olivia and Noakes, Anna.optc. (‘) 
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المعلومات. ذلك من خلال تجهيز و إعداد المصطلحات أمام المستفيد دون 
الحاجة إلى محاولات الصواب و الخطأ في صياغة كلمات البحث. 


لا يحتاج أسلوب التصفح الجهد اللازم لمعرفة معاملات وآليات البحث داخل 
محركات البحث التي تختلف من محرك إلى آخر ؛ حيث يوفر التصفح 
مصطلحات البحث بدون الحاجة إلى معاملات البحث للربط بينها و صياغة 
إستراتيجيات البحث. 


يوفر التصفح المرئي لوحدات الصور الرقمية سهولة الاختيار والبحث 
للمستفيد من خلال التعرف إلى موضوعات الصور بطريقة أقل من تلك 
المستخدمة مع فوائم المصطلحات. 

يتميز أسلوب التصفح بالمصطلحات بأن المستفيد يستطيع من خلاله الإبحار 
داخل المصطلحات ذات الدلالة على محتوی 9 موضوع الصور الرقمية. وهو ما 
gere‏ التعرف إلى السمات الموضوعية لوحدات الصور داخل قاعدة البينات. 
تستطيع المستويات المختلفة من المستفيدين التعامل بكفاية كبيرة مع أسلوب 
التصفح ؛ حيث إن أسلوب البحث بالكلمات المفتاحية موقوف فقط على 
المستفيدين أصحاب المهارات معاملات وآليات البحث على الويب. 

يؤدي استخدام أدوات اللغة المقيدة في تصفح المكانز وقوائم رؤوس 
الموضوعات إلى تحقيق درجات أكبر من التحقيق وخفض معدل الاستدعاء 
داخل نظم استرجاع الصورء وهو ما يعتمد على aal‏ في التكشيف والبحث. 


عيوب أسلوب التصفح 
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إن استخدام أسلوب التصفح بالمصطلحات يتطلب القدر الكبير من الدقة في 
تحليل محتوى الصور الرقمية التي تحمل معاني متباينةء وقد يؤدي تبني هذا 
الأسلوب إلى تشتت المستفيد في حالة الضعف الدلالي للمصطلحات. 

إن أسلوب التصفح المرئي لوحدات الصور يعمل بكفاية أكثر داخل قواعد 
البيانات الصغيرة؛ وهو مالا يصلح للعمل Jal‏ قواعد بيانات الصور كبيرة 
الحجم؛حيث يحتاج المستفيد الكثير من الجهد والوقت لتصفح مجموعات 
الصور. 
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ذاتية العمل فد لا ترفى إلى اعتماد المصطلحات ذات الدلالة لمحرك البحث. 


5 استخدام البحث بالكلمات المفتاحية 


يناسب هذا الأسلوب أكثر مرحلة بحث قواعد البيانات؛ حيث يجري 
استخدام هذه الكلمات لفتح النوافذ المختلفة لتناول الموضوع الواحد داخل فاعدة 
البحث. ولا يتوقف البحث بالكلمات المفتاحية عند البحث داخل حقل الواصفات 
الموضوعية أو رؤوس الموضوعات فقط. إنما يمكن استخدام أسماء المؤلفين أو 
شكل وسيط المعلومات المرئي Format‏ مثل GIF, JPEG‏ لتحديد وحدة واحدة من 
ling‏ القاعدة بتمثيل مجموعة من الكلمات دون تحديد الحقول التي تنتمي إليها. 
وعلى هذا فإن نظام استرجاع الصور الرقمية يعمل على مضاهاة كلمات البحث مع 
حقول التسجيلة الببليوجرافية كاملة إضافة إلى النص الكامل لصفحة الويب 
المصدرية مع حقول اللفة المعيارية HTML‏ ليخرج نظام استرجاع الصور بوحدة/ 
وحدات الصور التي يتوافر في أي من حقولها كلمات البحث المدخلة إلى النظام. 
ولعله يمكن القول إن البحث بالكلمات المفتاحية يعد الأسلوب الأكثر شيوعا بين 
المستفيدين لبحث مواقع/صفحات الويب. وإن أعطى ذلك في كثير من عمليات 
البحث نتائج غير دقيقة خلاف التصفح بالتقسيم الموضوعي؛ ذلك لاحتياج أسلوب 
الكلمات المفتاحية إلى آليات بحث دقيقة يستخدمها غير المتمرسين من مستخدمي 
الويب. ويبرز الدور المهم لأسلوب الكلمات المفتاحية في بحث قواعد محركات 
الصور إذا ما تحلى نظام الاسترجاع بحلية اللغة العربية مع اعتماد اللغة الطبيعية 
(لغة النصوص الكاملة) كلفة تنظيم لموضوعات ووحدات الصور. ويمثل الموضوع 
الواحد داخل اللغة العربية أكثر من كلمة دالة (ترادف) . كما تتخذ الكلمات 
المفتاحية أكثر من JSS‏ في البحث (المفرد. المثنى» الجمع) . ويستخدم 
المستفيدون الأشكال المختلفة في بحث موضوع واحد وذلك بحسب طريقة التعبير 
عن الموضوع أو مدى تخصص المستفيدين. وعلى الجانب الآخر فإن الصور بأبعاد 
تحليلها الموضوعي الثلاثة يختلف التعبير عنها من شخص إلى آخر مما يولد معه 
واصفات متعددة للصورة الواحدة. ومن شأن أسلوب الكلمات المفتاحية تحقيق 
التوافق والاطراد بين الأشكال المختلفة للتعبير عن الموضوع الواحد داخل اللفة 
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dy pall‏ مع موضوعات الصور المتعددة والمتنوعة بصياغة إستراتيجية بحث مكونة 
من أشكال مختلفة للموضوع للكلمة الواحدة وموضوعات مختلفة للصورة الواحدة. 
ولتقريب هذا النموذج من استخدام الكلمات Apa Ball‏ فإن بحثا كلماته (مصر, 
مصريون. المصري. مصرية - الأهرام» الأهرامات. الهرم) يمكن صياغته في 
مصر (مع السوابق واللواحق) + and‏ هرم (المشتقات) . 

ويحتاج أسلوب الكلمات المفتاحية في بحث النصوص الكاملة بلغتها 
الطبيعية إلى ee‏ من آليات البحث القادرة على صياغة مختلف إستراتيجيات 
البحث بما يحقق الدرجة المرجوة من التحقيق في استرجاع الصور الرقمية. 
وتتكامل آليات بحث اللغة العربية مع آليات البحث العامة لإجراء عمليات البحث في 
نظام عربي لاسترجاع وسائط الصور. وتعمل الآليات العامة مثل معاملات الربط 
البوليني ومعاملات البحث الحر مع مختلف لغات cde!‏ كما تعمل اليات بحث مثل 
البحث plat‏ والبحث dem UL‏ والبحث بالمعنى. والبحث بالمشترك اللفظي... 
وغيرها لمعالجة خصائص اللغة العربية. ويقترح slat cs‏ نري انبعت 
بالكلمات المفتاحية كمحور عملية البحث والاستدعاء داخل قواعد بيانات محرك 
الصور مع تحقيق آليات البحث السابق ذكرها في الفصلين الثالث والرابع سواء 
العامة أو التي تخدم اللغة العربية. مما يمكن معه تحقيق أكبر قدر من الدقة في 
استرجاع الصور bd‏ العربية» ويمكن القول إن الاستخدام الأمثل لآليات بحث 
النظام يمكن معه تحقيق أفضل استدعاء مع أفضل تحقيق لوحدات النظام 
المستدعاة. 


V التي يمكن تحويلها ا‎ EN ate aaa 
=: لإستراتيجيات بحث الويب» وهي مثل‎ 03s 


فمن مميزات البحث بالكلمات المفتاحية:- 
.١‏ يمكن للمستفيد القفز السريع إلى الصفحات المحددة لخدمة الموضوع إذا ما 


أتقن استخدام آليات البحث. 


Keyword Searches.[with out publisher], 2002, visited 10/10/2002, (*) 
http://www.concentric.net/~Rkriesel/Search/S-Keywords.htm 
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يستطيع المستفيد الحصول على صفحات الويب غير المدرجة في قوائم 
البحث للأدلة إما لعدم وجود المهارة في معرفة الموضوع أو لعدم وجود الوقت 
الكافي للتعامل معها. 

يرتفع معدل حداثة صفحات الويب داخل أدوات البحث المعتمدة على برامج 
الزاحف والعنكبوت نظرًا لتعاملها السريع في الإضافة والمعالجة المعلوماتية 
أسرع من الإنسان. 


وبالمقابل فإن من عيوب البحث بالكلمات المفتاحية:- 


.١ 


قد لا يستطيع المستفيد الحصول على صفحات الويب الملائمة إذا ما افتقر 
إلى الكلمات المفتاحية على الموضوع. 

OY‏ الكلمات المفتاحية هي العمود الفقري لمحركات البحث. فإنه لا يمكن 
بذلك تصفح محتويات أي من المحركات إذا ما افتقر الباحث إلى كلمات 
إرشادية قد يحصل عليها من خلال البناء الهرمي للموضوعات في التصفح 
الموضوعي. 

البحث بالكلمات المفتاحية داخل محركات البحث يستدعي معه الغث والثمين 
من المعلومات BAS‏ أدلة البحث التي تخضع للتقييم البشري. 

لا يضم محرك بحث بعينه كل مجموعات الويب. مما يستلزم معه بحث أكثر 
من محرك. 

يحتاج البحث بالكلمات المفتاحية إلى مهارة التعرف إلى آليات البحث 
المساعدة للكلمات المطروحة على نظام الاسترجاع . 


ويتضح مما سبق أن أفضل الأساليب في استرجاع الصور هو الجمع بين 


الأسلوبين التصفح مع البحث بالكلمات المفتاحية. 


5 استخدام آليات بحث اللفة العربية 


تعامل مع المفردات العربية تعالج بها مشكلات الاسترجاع الآلي للكلمات العربية. 
وقد تضمن الفصل الثالث نوعي آليات البحث العربية للكلمة الواحدة وآليات البحث 
بكلمات متعددة. ويعد التحليل الصرفي للفة العربية باستخدام المعاجم الآلية 


—Y¥4o — 


العامل المحوري لتفعيل آليات بحث للكلمات العربية. وعلى هذا فإن محرك بحث 
صور باللغة العربية يمكن بحثه بآليات البحث التالية :- 


آليات البحث بالكلمة الواحدة :- 


البحث بالتطابق 

البحث غير المطابق (البحث باللواصق) 
البحث بجذر الكلمة (حل مشكلة الاشتقاق) 
البحث بالتشكيل لكلمات المشترك اللفظي 
البحث الحر 

البحث بحساسية الحالة 

البحث بالترادف 

البحث بالمتضادات 

البحث بالمعاني 

البحث بالترجمة 

إمكانية التعرف إلى الأخطاء العربية الشائعة أثناء البحث 
البحث بتشابه النطق في اللفة الإنجليزية 


آليات البحث بكلمات متعددة :- 


البحث في الحقول 

البحث بالتقارب 

استخدام المنطق البوليني 

طرح سؤال للبحث: قائمة توفف عن الأحرف والادوات 
استخدام علامات التطابق 

البحث المعقد او المركب 

البحث بمثال (- /+ تقدير الأهمية) 


ويرى الباحث أن هناك وجهين لاستخدام برنامج المحلل الصرفي؛ أولهما 


في مرحلة التنظيم باستخدام التحليل المعجمي لمعالجة أخطاء المكشفين عند 
الإدخال أو معالجة أخطاء النص الكامل للصفحات المصدرية. أما الوجه الآخر 
لاستخدام المحلل الصرفيء وهو ما يتناسب مع الاستدعاء لمحرك بحث الصور. أن 
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يعمل البرنامج على معالجة الكلمات المفتاحية المدخلة للبحث Liag‏ لما أراده 
المستفيد من آليات بحث التضاد أو المعنى أو الترادف؛ حيث يعالج البرنامج الكلمة 
كلمات النصوص والتسجيلات في مرحلة أخرى لاستدعاء الوحدات الناتجة عن 
المضاهاة. ويعين برنامج المحلل الصرفي على إدخال الكثير من آليات البحث 
الملائمة للبحث باللغة العربية مثل البحث بجذر AA‏ البحث بالمعاني. البحث 
بالمقابلات في اللغات الأخرى. البحث بالمشترك اللفظيءالبحث بالترادف البحث 
بمعالجة الأخطاء العربية الشائعة... إلخ. 


Y/Y/*‏ الترجيح بين النتائج (الترتيب بحسب الصلة) 


يعني الترجيح بين النتائج في نظم الاسترجاع ترتيب النتائج المستدعاة 
بحسب الصلة Relevance‏ مع الكلمات المفتاحية المدخلة؛ ويعتمد ذلك في جوهره 
على وزن Ranking‏ جميع الوحدات المستدعاة مما يضع تلك الوحدات في ترتيب 
يساعد المستفيدين على توفير الوقت في تحديد درجة التحقيق وتقليل الجهد 
بإخراج أفضل النتائج. وتأتي عملية الوزن بعد حصر النظام لجميع الوحدات 
المطابقة لكلمات الموضوع المدخلة إلى قاعدة البيانات؛ حيث يعمل نظام الاسترجاع 
على المفاضلة بين الوحدات لزيادة مقدار الدقة في عرض النتائج التي يرى 
المستفيدون منها الجزء الأصغر فقط. ولترتيب وحدات النتائج أهمية كبيرة عند 
مستخدمي الويب؛ وهذا يرجع إلى زيادة أعداد الوحدات المستدعاة التي قد تصل 
إلى عشرات الآلاف من صفحات الويب. مما يصعب daa‏ تصفح هذا العدد Lal‏ 
لقصر وفت البحث او لما تتسم به محركات البحث من جمع الغث والثمين من 
مصادر المعلومات على الويب. مما يزيد بدوره من عدد ling‏ الشوشرة داخل 
النتائج. على ذلك فان مستخدم الويب يمكن يكتفي بتصفح الوحدات الأول إذا ما 
اعتمد محرك البحث على آلية وزن وترتيب النتائج المسترجعة. وتزداد قيمة ترتيب 
نتائج البحث كلما جنح شكل الوحدات المسترجعة إلى القراءة أو كانت في شكل 
نصوص ALIS‏ وهذا يعكس dae‏ سهولة تصفح نتائج الصور الرقمية التي تحتاج 
فقط إلى المشاهدة السريعة للحكم على صلة الصور المسترجعة بموضوع البحث. 
وبرؤية أخرى. فإن محركات الصور الرقمية تحتاج إلى آلية وزن النتائج وترتيبها 
نظرًا لارتفاع الأعداد المستدعاة من الصور الرقمية داخل محركات بحث الصور 
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والتي قد تصل إلى مئات الآلاف في بعض عمليات البحث. وعلى هذا فإن أهمية 
الوزن والترتيب تزداد بزيادة حجم فواعد البيانات. 


وتقوم عملية وزن النتائج لتحديد مدى الصلة على عاملين أساسيين هما؛ 
الأول : مدى تكرار الكلمات المفتاحية المدخلة في الوحدات المسترجعة. وبحسب 
عدد مرات التكرار يتم ترتيب الوحدات المطابقة لكلمات البحث من الأعلى تكرارًا 
إلى الأقل, وبذلك يمكن تحديد أكثر الوحدات صلة بموضوع البحث. ويعتمد هذا 
العامل على مبدأ يشبه التكشيف الإحصائي وهو أن الكلمات الأعلى تكرارًا داخل 
صفحة الويب هي الأكثر صلة بموضوع تلك الصفحة. أما العامل الثاني : فهو نوع 
الموقع داخل صفحة الويب الذي توافرت فيه الكلمات المفتاحية المطابقة للكلمات 
المفتاحية المدخلة لقاعدة البيانات. وبحسب نوع الموقع يتم ترتيب النتائج. وعلى 
ذلك فإنه إذا ما توافرت الكلمات المفتاحية في عنوان أو مسار صفحة الويب فإن 
هذه الصفحة تأخذ مكانا متقدما في الترتيب من تلك التي جاءت الكلمات 
المفتاحية بها في حقل الوصف الموضوعي وهذه بدورها تأخذ ترتيبا في النتائج 
أعلى من التي cele‏ بها الكلمات المفتاحية في النص الأصلي للصفحة؛ إلا أن 
تناول العاملين السابقين في وزن صفحات الويب وترتيب النتائج يختلف تطبيقه من 
محرك إلى آخر؛ حيث تفضل بعض المحركات مواقع محددة في بنية الصفحات 
pages structure‏ على الأخرى. كما تأخذ بعض محركات البحث اعتبارات أخرى 
للحكم على مدى الصلة داخل صفحة الويب. وتعرض شركة Web Requester‏ هذه 
الاختلافات في شكل ملامح مختلفة لمحركات البحث في وزن وترتيب النتائج 
(OR. (s‏ 
o‏ إنه كلما تواردت الكلمات في العنوان كان الارتباط بالموضوع أقوى في صفحة 

الويب. 
e‏ الاهتمام بحقل Metatag‏ لما يعرض المصممون داخله من كلمات واصفة 
للموضوع. 


Search Engine Placement & Search Engine Ranking Service. Website Register, 2002, (1) 
visited 31/10/2002,: 
http://website-register.com/search engine ranking, standard.htm 
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e‏ كثافة الكلمات المفتاحية في الصفحة؛ أي مدى توارد الكلمة في النص. 


e‏ مدى شيوع الصفحة فى الصفحات الأخرى : وهو عدد روابط الصفحة 
المكشفة في صفحات الويب الأخرى. 


e‏ تقييم لغة الترميز المعيارية داخل الصفحة. وحصر أخطاء الرموز والتصميم. 
o‏ مقدار وقت التحميل الذي تقل القيمة daa‏ كلما زاد وقت تحميل الصفحة. 


ويرى الباحث أن آلية وزن النتائج بتحديد موقع الكلمات المفتاحية تلائم 
أكثر العمل داخل محركات بحث الصور؛ حيث تمر الصور الرقمية بأساليب تنظيم 
ومعالجة تختلف عن تلك المعتمدة على النصوص. ويمكن إعطاء قيم ثابتة لكل 
موقع داخل بنية صفحات وملفات الصور الرقمية يتم على أثرها حساب الوزن 
الكامل لوحدات الصور المطابقة لكلمة وعبارة البحث. وبذلك يتم ترتيب الصور 
المسترجعة المطابقة حسب مدى الصلة بالموضوع امام المستفيدين مع التلميح 
بقيمة النتائج الأول للمستفيدين. 


5 مراحل عرض النتائج 
Ag 1a V/Y/3‏ محرك بحث الصور 

إن أول ما يراه المستفيدون في تعاملهم مع محركات بحث الصور هي 
واجهة البحث. وعلى ذلك فإن مثل هذه الواجهة تعطي الانطباع الأول عن كفاية 
ومجموعات نظام استرجاع الصور. وتعود أهمية واجهة البحث إلى أنها تضع 
المستفيد على الشكل الصحيح لاستخدام اليات بحث zauela‏ بيانات الصور. وواجهة 
البحث ذات اللغة المعيارية تختلف عن تلكم التي تتعامل مع فاعدة البيانات» ويطلق 
على الواجهة الثانية اسم CGL‏ ولقد تبنت محركات البحث في تصميمها لواجهة 
البحث نوعين؛ فمنها من اختار شكل الواجهات المزدحمة بالصور مع القصور في 
آليات بحث المجموعات. ومنها أيضًا ما يعتمد على الواجهات البسيطة التي تهتم 
فقط بعرض كل آليات البحث المستخدمة في استرجاع مجموعات الصور الرقمية. 
ويقترح الباحث أن تكون كل آليات البحث في الواجهة الأساسية لمحرك البحث 
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محركات الويب يعتمدون على إدخال الكلمات المفتاحية فور ظهور الواجهة الأساسية 
لمحرك البحث. 


5 شكل آليات البحث 

تطرح محركات بحث الصور آليات بحث في شكلين أساسين هما القوائم 
المنسدلةء. ويعتمد هذا الشكل على تجميع كل معاملات آلية البحث الواحدة داخل 
قائمة واحدة؛ ذلك مثل أن ينيح محرك البحث استدعاء الصور بحسب حجم 
الصورة؛ فإن القائمة في هذه الحالة تحوي كل الأحجام التي تأتي بها الصور داخل 
قاعدة بيانات محرك البحث وعلى المستفيد هنا اختيار الحجم المناسب من هذه 
القائمة. أما الشكل الآخر من آليات بحث المجموعات فهو شكل الترميز؛ حيث 
توضع أمام المستفيد كل معاملات آلية البحث صقا بجانب الاسم الدال على الية 
البحث. ويتيح محرك البحث في هذه الحالة إمكانية تنشيط أو إيقاف عمل هذه 
المعاملات من خلال وضع علامات الترميز لكل من المعاملات المراد استخدامها 
في استدعاء الصور. 


ويقترح الباحث استخدام الشكل الثاني لآليات البحث (الترميز)؛ لأن إتاحة 
مختلف معاملات البحث ظاهرة أمام المستفيد الذي يعمل على التعريف السريع بكل 
اليات البحث ومعاملاتها المستخدمة في صياغة إستراتيجيات بحث ice gas‏ 
كما أنه يعطي قدرًا أكبر من الكفاية في اختيار معاملات البحث المعبرة عن 
الحاجة الموضوعية للمستفيد والتي يجب أن تنعكس على صياغة إستراتيجية البحث 
لتناسب الصور المستدعاة. 


5ع عدد واجهات البحث 

ينقسم المستفيدون من حيث الكفاية مع آليات ومعاملات بحث الويب إلى 
قسمين؛ الأول والذي لا يستخدم في بحثه سوى الكلمات المفتاحية بغض النظر عن 
معاملات البحث وآلياته الملائمة لاستدعاء الموضوع. أما القسم الآخر فيعتمد على 
صياغة إستراتيجية البحث بالشكل الذي يصلح معه استدعاء مصادر المعلومات عن 
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الموضوع من جانب معين. ونتيجة لما سبق فإن تعدد واجهات بحث المجموعات 
يشكل في ذاته الفائدة والعائق للمستفيدين وذلك بحسب مستوى التعرف إلى نظام 
الاستدعاء. وتضع بعض محركات بحث الصور الصفحات التي تحوي مختلف الياتها 
ومعاملات بحث المجموعات تحت مسمى (Advanced Search‏ وعادة ما يرد ذكر هذا 
المسمى بجوار فراغ البحث في الواجهة الأساسية. وهو ما لا يعمل عليه الكثير من 
المستفيدين. ومن ثم فيقترح الباحث أن تستخدم واجهة بحث واحدة على أن تتجمع 
بها كل آليات ومعاملات البحث التي يوفرها النظام. 


5 تقسيمات واجهة البحث 


إن الشكل الكامل لإفادة مستخدمي محرك بحث الصور يعود إلى توفير 
مختلف أساليب وآليات البحث في واجهة واحدة. على أن تكون هذه الواجهة 
واضحة وبسيطة في الوقت نفسه الذي تزدحم فيه بآليات ومعاملات البحث 
اللازمة للتعبير عن مختلف أشكال الموضوعات. وعلى ذلك فإن النقسيم الداعم 
لذلك يمكن أن يكون على النحو التالي؛ أولا: أن يتم تقسيم واجهة البحث إلى 
قسمين lias]‏ بحيث يشمل القسم الأعلى فراغ البحث اللازم لإدخال الكلمات 
المفتاحية. يأتي أعلى ذلك اسم محرك البحث ثم تأتي خيارات البحث باللغة 
أسفل فراغ البحث بالكلمات المفتاحية. أما القسم الآخر (السفلي) من الصفحة 
يتم تقسيمه إلى شطرين؛ الأول إلى يمين الصفحة ويحوي هذا القسم التقسيم 
الموضوعي أو أسلوب البحث بالتصفح ؛ سواء اعتمد التقسيم الموضوعي هنا على 
الترتيب الهجائي لكل المصطلحات المستخدمة أو الاعتماد على إحدى خطط 
التصنيف الحصرية لموضوعات المعرفة مثل خطة ديوي أو خطة التصنيف 
العشري العالمي. أما الشطر الآخر من القسم الثاني (يسار الصفحة) فيضم 
مختلف آليات البحث المتاحة لاستدعاء الصور والتعامل مع قاعدة البيانات. بحيث 
توضع كل المعاملات الخاصة بكل آلية بحث بجانب اسم آلية البحث. وترتب 
آليات البحث بحسب أهميتها في إجراء بحوث المستفيدين. ويمكن الاستعانة 
بالشكل الخاص لمحركي البحث corbis, ditto‏ لبناء الشكل المطلوب لوجهة بحث 
محرك الصور. 


EN EN 


5 واجهة نتائج محرك بحث الصور 
5 شكل الصور المعروضة 

تحتاج محركات بحث الصور إلى صياغة ملامح أخرى غير التي تتعلق 
بتنظيم وبحث الصور الرقميةء وتتعلق هذه الملامح بالجانب المرئي لوسيط 
الصور الثابتة. ومن هذه الملامح؛ اختيار الصور الرقمية ذات الكثافة الملائمة 
لعرض محتوى الصورة Ll, Resolution‏ حجم اللقطات المعروضة داخل النتائج, 
بجانب التداخل بين البيانات واللقطات داخل وحدات النتائج المعروضة. وتأتي 
أهمية الشكل المعروض به النتائج لما له من تأثير على سرعة تصفح النتائج مع 
تحديد المستفيدين لمجموعات الدقة والشوشرة داخل النتائج. ويرى الباحث أن 
شكل العرض المنفرد للصور مع إضافة بعض الرسومات يمثل أفضل البدائل 
للتعامل مع مجموعة كبيرة من الصور التي قد تصل إلى عشرين ٠١‏ لقطة في 
واجهة البحث الواحدة فضلا عن الرسومات التى تعطى اختيارات التعامل لكل 
ضور على use‏ مر اتفال إلى اة dida SN‏ ين اة أو ignc‏ 
النشر... وغيرها. 


5 البيانات الببليوجرافية المصاحبة 


اعتمدت بعض محركات بحث الصور على إلحاق بعض البيانات 
الببليوجرافية مع الصور المعروضة في واجهات النتائج. وتؤدي الحقول 
الببليوجرافية مع اللقطات المعروضة إلى صغر حجم هذه اللقطات مع التداخل بين 
البيانات واللقطات الممثلة للصور. ويقترح الباحث عرض اللقطات منفردة مع وضع 
رسومات لتحديد الاختيارات والتعامل. مع حذف البيانات الببليوجرافية على أن 
تكون التسجيلة الببليوجرافية متاحة أمام المستفيدين دون إجراء تعديلات في 
البيانات المعروضة. 
5 عدد الصور المعروضة 

يرتبط عدد اللقطات أو الوحدات المعروضة في نتائج البحث مع سرعة 
تصفح المستفيد لهذه النتائج» على أن التحديد المسبق من جانب محرك البحث قد 
لا يلائم ما يرجوه المستفيد من سرعة المرور على مئات الصور الرقمية. ويرى 
الباحث أنه يمكن التغلب على عدد اللقطات بفتح الكثير من النوافذ أمام المستفيد 


—- او “نت 


مستخدمي الويب للتغلب على بطء التحميل. 


5 الروابط داخل عرض النتائج 

عملت محركات بحث الصور على إلحاق مجموعة من الروابط مع 
اللقطات الممثلة للوحدات المسترجعة. وتشمل هذه الروابط الانتقال إلى الصفحة 
المصدرية للصورة الرقمية. وأيضًا الارتباط بصفحة الصورة التي تحوي الحجم 
الحقيقي للصورة والذي ينتهي مساره دائما ب JPG‏ 615. وقد استبدلت الدراسة 
هذه الروابط بمجموعة من الرسومات النشطة المعبرة عن اختيارات التعامل مع 
الصورة. على أن تكون كل من هذه الرسومات رابطا لما ترمز إليه؛ فتشير 
إحداها إلى التسجيلة الكاملة للصورة. أو الانتقال للصفحة المصدرية. أو تحميل 
الصورة. أو إرسالها كرسالة بريد إلكتروني. أو عرض الصورة فقط في الحجم 
الحقيقي. 
51 ملامح احتياجات المستفيدين في محرك البحث 

لقد أكدت دراسة C. Olivia Frost‏ عن استرجاع مجموعات الصور الرقمية أن 
هناك مجموعة من الملامح التي يحتاجها مستخدمو محركات بحث الصور والتي 
تساعد على دعم البحث والوصول إلى الصور الرقمية داخل قاعدة البيانات. يمكن 
استحد ام طلن الملامح لتدعيم pee‏ البح المقترح هناء ومني" ب 

احتياج المتمرسين من المستخدمين إلى إمكانات تقنية وفنية للتحكم وإطار 
الصور الرقمية وإمكانية عمل مقارنة بين ثلاث أو أربع وحدات من الصور 
المعروضة في شاشات النتائج مع عرض البيانات الخاصة بكل وحدة من الوحدات 
المعروضة. 

وقد SÍ‏ المتمرسون وغير المتمرسين من المستخدمين أيضًا على إمكانية 


التحكم في ملفات الصور الرقمية بالنسخ أو التحميل أو الإرسال عبر البريد 


Frost, C. Olivia and Taylor, Bradley and Noakes, Anna. Browse and Search Patterns (1) 
in a Digital Image Database, University of Michigan, 2002?, cuted at 6/10/2003, vis- 
ited at http://www.si.umich.edu/~cfrost/papers/fidel.html 
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الإلكتروني؛ إلا أن ذلك يعتمد بقدر كبير على حقوق النشر والاستخدام المتعلقة 
بالصور على الويب. 

الاحتياج إلى إجراءات أخرى للمساعدة في البحث عن الصور مثل تهذيب 
نتائج البحث بتوفير إمكانية البحث داخل النتائج أيضًا إمكانية البحث بأسماء 
المصورين المؤلف ٠‏ كما يمكن استرجاع الوحدات المشتركة مع وحدة من النتائج؛ 
إذا ما وجد xia‏ بها الخصائص الملائمة لموضوع البحث أسفل عبارة صور 
أخرى مشابهة لهذه . 

أن يتمتع عرض الصور داخل محرك البحث بكثافة عالية للصور المعروضة 
حيث يمكن اعتمادًا على ذلك زيادة عدد الوحدات في شاشات النتائج الواحدة؛ أو 
الاستفادة من ذلك عند تحميل تلك الصور. 


5 الخلااصة 

عملت الدراسة في هذا الفصل على تبني مجموعة العناصر المقترحة لبناء 
محرك بحث عربي يدعم خصائص اللغة العربية. وقد بدأت هذه العناصر بالحديث 
عن ملامح محددة لتكشيف ملفات الصور الرقمية على الويب والتعامل معها من 
ناحية تنظيم Gling‏ المعلومات على الويب. ثم الجزء الآخر عن الجوانب العملية 
لمحرك بحث ربي للصور الرقمية. بداية من افتناء ملفات الصور ثم مرحلة 
التكشيف والبحث لوحدات الصور الرقمية. إلى جانب الحديث عن استخدام اللغة 
العربية داخل محرك البحث والعمل بها في عمليات التنظيم والبحث. 
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نتائج الدراسة 


نتائج الدراسة 


توصل الباحث إلى مجموعة من النتائج يجملها فيما يلي: 


.١ 


إن التعدد والتنوع في أشكال وسائط المعلومات الرقمية المرئية التي أفرزتها 

بيئة الويب» يحتاج بدوره إلى تكثيف الدراسات Jal‏ علم المكتبات والمعلومات 
للخروج بالأطر والمعايير التي يمكن بها بناء مواصفات تنظيم واستدعاء لمثل 
هذا الخضم الهائل المتنوع من أوعية المعلومات. ويرتبط بذلك أن المفهوم 
العام للإنترنت إنما هو مصدر معلومات شامل لكافة المعلومات بمختلف 
أشكالها. 


إن التنامي السريع لمحتوى الإنترنت قد أثر على ملا حقة 3 تطور وتعدد وسائطه 
النصية والصوتية والمرئية. Las‏ يعكس عدم كفاية هيئة واحدة لرعاية تنظيم 
المعلومات على الإنترنت. 


إن أساليب بحث الويب وتنوع أدوات البحث على الويب مازالت في حاجة أكبر 
إلى تطويرهاء حيث إن أغلب أدوات البحث تعمل Ler‏ يوافق المستوى الأدنى من 
مهارات المستفيدين في بحث معلومات الويب. وهو ما يؤثر بدوره على تطوير 
آليات بحث مصادر الويب غير النصية . 


تتواجد نظم استرجاع الصور في مستويين مختلفين؛ الأول: نظم إدارة الصور 
الرقمية وهي نظم تعمل على المعالجة الفنية الكاملة لملفات الصور من تنظيم 
ومعالجة ثم توفير أساليب البحث الملائمة لاسترجاع ملفات الصور. الثاني: 
نظم بحث وتصفح الصور ومنها محركات بحث الصور وهي نظم تعمل على 
بحث تصفح الصور من خلال النصوص المحيطة بها دون تحليل ملفات 
qual‏ 
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تركز محركات البحث غير العربية على ملفات بعينها في إدخال ملفات الصور 
الرقمية داخل قواعد بياناتها. وهو ما يساعد على تشكيل الصورة الذهنية أو 
تحويل اتجاه الرأي العام لمستفيدي الويب من خدمات بحث الصور في بعض 
القضايا العامة السياسية أو الاجتماعية, وذلك في استخدام بعض الكلمات 
البحثية التي تشكل بذاتها قضايا عالمية al yall fie‏ الشرق الأوسط. الإرهاب. 
الإسلام ... إلخ. مما يجعل من محركات بحث الصور الرفمية الثابتة تؤدي 
دروا غير Gay‏ في التعبير عن قضايا محددة . 


جاءت نسب تحقيق محركات بحث الصور على الويب ضعيفة Ayla‏ ويعود 
السبب في ذلك إلى غياب معيار ثابت لبناء ملفات للصور الرقمية وبداخلها 
التسجيلة الببليوجرافية الواصفة مع مجموعة الكلمات الواصفة للعناصر 
الموضوعية داخل الصورة سبب ضعفا في بناء ملفات الصور الرقمية . 

إن بناء قواعد بيانات الصور الرقمية داخل الكثير من المؤسسات مثل 
المتاحف وهيئات الأبحاث الفضائية. بل والأرشيفات الصحفية لن يتم بشكل 
صحيح إلا بالاعتماد على عاملين هما ؛ تبني معيار لوصف الصور الرقمية مثل 
دبلن كور مع إجراء التعديلات اللازمة dale‏ إلى جانب استخدام تقنيات بناء 
ملفات الصور الرفمية التي تضم النص إلى جانب المحتوى المرئي في ملف 
واحد لا ينفصل به النص عن الصورة. 


يعد معيار دبلن كور أفضل معايير الوصف الفني التي تتعامل مع الصور 
الرقمية؛ حيث يعتبر هذا المعيار أكثر المعايير اهتماما بوصف المحتوى من 
خلال تخصيص عنصري الموضوع subject‏ والوصف description‏ إلى جانب 
عناصر الوصف المادي. كما أن هذا المعيار يسير في تطوير مستمر بما يمكن 
له معالجة ملفات الصور الرقمية بلغة XML.‏ 


أوضحت دراسة استرجاع الصور الرقمية العزلة التامة في العمل بين استرجاع 
الصور المبني على النص واسترجاع الصور المبني على المحتوى. ويتبع 
الاسترجاع بالمحتوى تقنيات تحليل الصورة باستخدام البنية والشكل واللون, 
خلاف ما يعمل به الاسترجاع بالنص في الاعتماد على التكشيف والبحث 
للكلمات المفتاحية. وأن الجمع بين النوعين في نظام واحد يفيد باحثي الصور 
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في استرجاع صور ذات بنية أو شكل أو لون محدد بنفس الحاجة الموضوعية 
للباحث. 


. تعمل جميع محركات البحث باستخدام آلية واحدة لتنظيم وبحث مصادر 


الويب. وذلك على الرغم من اختلاف وسائط حمل المعلومات وتعددها داخل 
الوسيط الواحد. وأكد ذلك التوحد في بناء محركات البحث اعتمادها على 
ثلاثة برامج فرعية لجمع وتنظيم وبحث معلومات الويب المختلفة» تعمل هذه 
البرامج باليات مخصصة لاسترجاع النصوص. 


. لعتمد محركات الويب عامة ومحركات بحث الصور خاصة على برامج الزاحف 


في انتقاء وإضافة مصادرها من أوعية المعلومات. وعلى ذلك فإن الفلاتر 
(المرشحات) داخل أدوات بحث الويب تعمل من خلال بناء سياسة التوقف 
والمرور Stop/Golist‏ داخل برنامج الزاحف. 


. أن تنظيم وبحث المادة المصورة الرفمية بصفة عامة والمصورة الثابتة بصفة 


خاصة. يعتمد على التحليل الموضوعي لهذه الوسائط أكثر من اعتماد محركات 
البحث على السمات المادية أو استخدام تقنيات المطابقة للألوان أو التركيب. 
إلى جانب احتياج تنظيم المادة المصورة للتطوير الحتمي لبرامج الزاحف 
التى تتعامل مع النص المصاحب فقط لملف الصورة. 


. إن تنظيم ومعالجة ملفات الصور الرقمية يمكن أن يتعدى عناصر الوصف 


الفني إلى تقنيات تحليل ألوان وبنية ملفات الصور الرقمية. وتسهم المعالجة 
الرقمية إلى جانب المعالجة الفنية للصورة في رفع درجات التحقيق 
باسترجاع صور ذات بنية وشكل محدد لنفس المحتوى الموضوعي. وبذلك 
يمكن الجمع بين الاسترجاع المبنى على المحتوى والاسترجاع المبني على 
النص. 

تحتاج المعالجة الفنية للصور الرقمية إلى العنصر البشري أكثر من برامج 
محركات البحث. ويؤكد ذلك أن الاطراد بين الكلمات الوصفية والكلمات 
البحثية أيسر في جانب الوصف المادي. خلاف ما يحدث من التفاوت بين 
الكلمات الوصفية والكلمات البحثية في تحليل المحتوى الموضوعي. ويأتي ذلك 
من اعتماد برامج محركات البحث على أسلوب الاقتباس للنصوص المحيطة 
بالصورة أكثر من أسلوب التحليل لمحتواها . 
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يعتمد استخدام أسلوب البحث الحر أو أسلوب التصفح على طبيعة أداة البحث 
في الويب» حيث تعتمد محركات البحث في حالة المادة النصية على استخدام 


البحث الحر أكثر من محركات البحث الخاصة بالمادة غير النصية. وأن 
الجمع بين الأسلوبين أفضل في البحث مع محركات بحث الصور. 


إن الاعتماد على اللفة المقيدة في بناء أسلوب التصفح يمكن محرك بحث 
الصور من تحقيق أعلى درجات الاطراد بين تحليل محتوى الصور وبين 
استدعائها. وذلك بالاعتماد على أحد المكانز أو إحدى قوائم رؤوس 
الموضوعات. c9‏ إمكانية تصفح هده المكانز داخل محرك البحث تعرف 
المستفيدين على موضوعات gual‏ إلى جانب فهم كل موضوع على حدة في 
إطار السياق العام. 


. تعد آلية البحث بالعبارات هى أفضل آليات البحث المستخدمة بين محركات 


بحث الصور. يلي ذلك آلية البحث بالمنطق البوليني. ويرجع ذلك إلى ملاءمة 
اليحث بالعبارات لسهولة استخدامها بين مستخدمي محركات البحث بصفة 
dole‏ بالمقارنة مع aul‏ المنطق البوليني الذي يحتاج إلى Adae‏ رياضية. 


. تحتاج آلية البحث بحقول الوصف في محركات البحث إلى معابير ثابتة للتعامل 


مع وصف الصور الرقمية؛ حيث استخدمت محركات البحث آلية البحث 
بالحقول على استحياء من عدم وجود تسجيلات نهائية لملفات الصور تجمع 
بها حقول الوصف. cle‏ ذلك من خلال وضع بعض محددات لبحث الصور 
كالاختيار بين نوع الصورة و شكل ملف الصورة ولون الصورة و الحجم...الخ. 
إن asl‏ العربية Oly‏ كانت قد حظيت بمعايير البحث الآلي داخل فواعد بيانات 
الويب العربية أو التي تدعمهاء فإنها لم تحظ بهذا الاهتمام في محركات بحث 
الويب وخاصة تلك التي تتبنى البحث فقط في ملفات الصور الرقميةء وهذا 
إنما يعود لندرة أو انتفاء وجود محركات بحث صور عربية أو غياب ملفات 
الصور الرفمية الثابتة عن ذهن الباحثين في تنظيم المعلومات العربية. 


إن محركات بحث الويب عامة ومحركات بحث الصور خاصة الداعمة للفة 
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نتائج البحث أمام مستخدم الويب. حيث تغلب محركات البحث عامل 
الاستدعاء على عامل التحقيق في استرجاع نتائج كثيرة العدد لا تفي 
بالتخصيص المطلوب لمستخدم الويب. وهذا يرجع إلى ضعف الخصائص 
الآلية لمحركات البحث في دعمها اللغة العربية. 


إن مشكلات التمامل مع الصور الرقمية في البيئة الافتراضية العربية تتعدى 
حدود المشكلات اللفوية الصرفية إلى حد مشكلات المعنى والثقافة. وتستخدم 
تقنية التحليل الصرفي للتعامل مع المشكلات الصرفية؛ إلا ان مشكلات 
المعنى والثقافة تحتاج إلى إشراك العنصر البشري في التعامل مع محتوى 
EXTR‏ 


أظهر اختبار آليات بحث اللغة العربية مدى افتقار محركات البحث في 
استخدام تقنيات التعامل مع اللغة العربية. وهذا يرجع تحديدًا إلى قلة اهتمام 
محركات بحت الصور في ضم سلنات الحصور العربية نسبة إلى تلك 
الإنجليزية. ويعد محرك البحث Google‏ أفضل محركات الدراسة في التعامل 
مع اللغة العربية. غير أنه لم يستخدم Ul‏ من آليات البحث المتخصصة 
للتعامل مع اللغة العربية. 


أوضحت دراسة حقول الوصف الببليوجرافي داخل محركات البحث أن 
محركات بحث الصور لا تعمل من خلال معايير محددة, إنما تعمل اجتهادا 
لتوفير أكثر البيانات الببليوجرافية أهمية بالنسبة لباحثي الصور الرقمية. وقد 
كانت محركات البحث Corbis, Picsearch, Altavista, Fast‏ على الترتيب أفضل 
محركات الدراسة في التعامل مع حقول الوصف الببليوجرافي ؛ حيث عمل 
Corbis‏ على توفير أغلب حقول الوصف للبحث أمام المستفيد. أما Picsearch‏ 
فقد قدم أفضل أشكال التسجيلات النهائية لملفات الصور الرقمية. وجاء بعده 
محركا Fast g Altavista‏ في صنع التسجيلة النهائية. 

اتفقت جميع محركات البحث في العمل على استخدام نص صفحات الويب 
diog‏ مصدرًا UJ‏ لتكشيف وتحليل ملفات الصور الرقمية التي جاءت 
بداخلها. وهو ما يعني أن التكشيف بالاشتقاق لصفحات الويب مازال أساس 
العمل داخل محركات البحث. وقد شذ عن ذلك daas‏ محرك البحث ‘Corbis‏ 
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حيث أثر التدخل البشري على اختيار الكلمات المفتاحية بإدخال التحليل 
البشري لموضوعات الصور الرقمية. 


انقسمت البيانات التي تصاحب عرض الصور إلى قسمين ؛ الأول: البيانات 
الوصفية التي تعطي auos‏ لحجم وشكل ونوع الصورة وما إلى ذلك من العنوان 
والمسار. والثاني : خدمات التعامل مع الصورة ؛ حيث تعرض هذه البيانات 
الخيارات المطروحة أمام المستفيد للتعامل مع الصور المسترجعة. وقد تقدم 
محرك البحث Google‏ على كل المحركات الأخرى في عرض اكبر قدر من 
البيانات المصاحبة للنتائج ثم تساوت جميع المحركات بعد ذلك في عرض 
البيانات المحدودة. ويعد محرك البحث Corbis‏ أفقر محركات البحث في 
القسم الأول وأغناها في طرح اختيارات التعامل مع ملفات الصور؛ حيث 
يعرض إمكانية التحميل او الشراء او الإرسال. 


نخلرًا OY‏ محركات بحث الصور تعمل بطريقة تفاعلية غير ثابتة (ديناميكية) e‏ 
فإنه لا يصلح تطبيق أساليب قياس الكفاية في نظم الاسترجاع الثابتة على 
محركات البحث. ومن ثم فإن نظام لانكستر المخصص لأساليب قياس 
الكفاية في النظم الثابتة لا يصلح مع النظم غير الثابتة أو بمعنى محركات 
الويب. 


9 ¢ 0 
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التوصيات 


توصل الباحث إلى مجموعة من التوصيات يوجزها في الفئات التالية: 

الفئة الأولى: المكتبات الافتراضية 

.١‏ يجب على المكتبات العربية بوصفها مؤسسات خدمات المعلومات السعي لبناء 
مجموعتها من الصور الرقمية كأحد وسائط المعلومات المتعددة. وذلك لما 
يحمله وسيط الصورة الآن من أهمية في بحث المستفيدين في ظل قضايا 
تتعامل أكثر مع الجوانب الإعلامية والرؤية للأحداث أكثر من وصفها بالكلمات 
والألفاظ. 

Y‏ يجب على الشركات العربية العاملة في مجال الويب والداعمة لمحركات البحث 
الاتجاه نحو بناء الكثير من محركات البحث الداعمة للبحث في تنظيم وبحث 
المصادر العربية على الويب ومنها ملفات الصور الرقمية. 

.Y‏ يجب على المؤسسات العربية ولاسيما الإعلامية التي تتعامل مع ملفات الصور 
على الويب. الوعي الكامل بمفاهيم التكشيف في البيئة الافتراضية. فالبحث 
بالصور لا يعني في ذاته فقط تقديم خدمة بحث ملفات الصور الرفمية الثابتة 
بجانب باقي مصادر الويب. Lail‏ هو محاولة للتعبير عن بعض اتجاهات الصور 
العربية في القضايا التي يناقشها العالم مثل قضايا الشرق الأوسط والإرهاب 
والإسلام والقضية الفلسطينية. ويتجلى من ذلك الدور الإعلامي الذي يمكن 
أن تؤديه محركات بحث الصور الإعلامية. بل يجب بناء محركات بحث صور 
ثابتة تدعم فقط الصور الرقمية الإعلامية. 


الفئة الثانية: أقسام المكتبات والمعلومات ومراكز المعلومات 


t‏ يجب على أقسام المكتبات والمعلومات في الوطن العربي الاهتمام بدراسات 
عن نظم الاسترجاع في البيئة الافتراضية وذلك من خلال المناهج الدراسية 
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أو الدراسات العليا لما له من أثر بعد ذلك في أن تكون الويب أحد مصادر 
المعلومات المرجعية المهمة في خدمات المكتبات. 

يجب على أقسام المكتبات والمعلومات في الوطن العربي أخذ المبادرة بتأصيل 
مفاهيم تنظيم وبحث الأشكال المختلفة لوسائط المعلومات على الويب للتمييز 
بينه وبين الأبحاث التي تحيد نحو علوم الحاسبات أو الجوانب الفنية. 


الفئة الثالثه: المواصفات والمعايير الدولية 


n 


يجب على الشركات المنتجة والداعمة cala]‏ الصور الرقمية تبني معيار 
وصف للصور لانتاج ملفات الصور بالشكل الذي يتيح لمحركات البحث تكوين 
مجموعاتها من الصور بشكل يسهل عملية البحث. ويقترح أن يكون معيار دبلن 
كور هو البداية باعتباره أفضل المعايير حتى الآن إلى أن يتم التوصل إلى 
pulas‏ متخصصة في إنتاج ملفات الصور. 

يجب على الجمعيات العربية التي تعمل على تعريب بنية الويب الاعتماد على 
مجموعة من القواعد والمعايير الموحدة لمحركات البحث العربيةء مع العمل 
المشترك لانتاج ميتاداتا عربية تساهم في تجنب أخطاء تنظيم وبحث مصادر 
معلومات الويب العربية. 

يجب على المتخصصين في علم المعلومات وعلم اللغة دعم اللغة العربية كلغة 
محتوى وتنظيم لأوعية المعلومات بالمزيد من التطوير في معايير وتقنيات 
التخزين والاسترجاع الآلية لما تتسم به اللغة العربية من سمات عدة كالترادف 
والاشتراك اللفظي واللواصق ... إلخ التي تختلف بها عن غيرها من اللغات. 


وفي ظل هذه التوصيات يمترح الباحث مجموعة من الدراسات المقترحة 


لباحثين آخرين :- 


المادة الصوتية على الويب : دراسة لتنظيم وبحث الملفات الصوتية. 

محركات بحث اللقطات المتحركة الفيديو على الويب» لما تتسم به اللقطات 
من طبيعة تكشيف تختلف عن الأفلام. 

دراسة تحليلية متعددة الجوانب للمؤسسات الإعلامية على الويب في تنظيم 
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المراجع 


أولا: المراجع العربية الورقية 


m 


خالد محمد رياض. 

أدلة ومحركات بحث شبكة الإنترنت : دراسة مقارنة.- الإستراتيجية das pal!‏ 
الموحدة للمعلومات في عصر الإنترنت ودراسات أخرى. الاتحاد العربي 
للمكتبات والمعلومات. تونس. (أكتوبرةة19).- AYA‏ ص. 

زين عبد الهادي. 

محركات البحث على شبكة الإنترنت : دراسة تجريبية مقارنة. مجلة المكتبات 
والمعلومات Ye dy pall‏ أبريل .٠١ ga Yr Y‏ 

شعبان عبد العزيز خليفة و محمد عوض العايدي. 

المواد السمعية و البصرية و المصغرات الفيلمية في المكتبات و مراكز 
المعلومات.- Ydo‏ مزيدة و منقحة. ila palati]‏ مركز الكتاب LAU‏ ۱۹۹۷م. 
uoyt:‏ 


استرجاع المعلومات في اللغة العربية.- الرياض: مكتبة الملك فهد الوطنية. 
pelAs LM‏ 


غولد» تشيرل. 
البحث الذكي في الإنترنت: أدوات وتقنيات للحصول على أفضل النتائج؛ 
ترجمة عبد المجيد أبوعزة.- الرياض: مكتبة الملك aga‏ الوطنية. ١١٠٠م‏ 


۸, ص. 
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ثانيًا: 


A 


ju‏ ( ولفرد. 

نظم استرجاع المعلومات؛ ترجمة حشمت قاسم._ القاهرة :دار غريب 
للطباعة والنشر والتوزيع. ۱۹۸۱. ٠١١‏ ص. 

Gils‏ محيى Qual‏ عطية. 

جهود تصنيف المعرفة فى البيئة الإلكترونية : دراسة استكشافية.- الأكاديمية 
للمكتبات والوثائق والنظم المعلوماتية. ع١ -.)۲۰۰٤(‏ صه-ل/الا. 

Gils‏ محيى الدين عطية. 

تكشيف الصور بين العلم والتعلم : ورقة في ملف القضية الفلسطينية.- 
أسيوط: المؤتمر القومي الخامس لاختصاصي المكتبات والمعلومات والأرشيف 
في مصرء Ys!‏ 
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http://www.arabcin.net/arabic7/nadweh/print pages/print 9oe20fourth, pivot/his- 
torical_doc.htm 


.٠‏ أحمد محمد المعتوق. 


الألفاظ المشتركة المعاني في اللغة العربية طبيعتها ‏ أهميتها ‏ مصادرهاء 
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http://www.uqu.edu.sa/majalat:/shariaramag/mag21/MG-012.htm‏ 
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عبد الرحمن بن حسن المحسني. 


فضية الترادف : النظرية والتطبيق؛ تاريخ الاستشهاد aY Y/Y‏ 


http://www.adabiabha.com/biader/4.htm 


— ۴۹۹ ا 
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الملحق رقم )*( 
قائمة مصطلحات الدراسة 
(إنجليزي - عربي) 


المصطلح العربي 
فراغ العنوان 
الرسوم الحيوية 
التكشيف بالتعيين 
بطاقة الوصف الببليوجرافي 
المنطق البوليني 


معاملات المنطق البوليني 

[البحث] بحساسية حالة الحروف 
البحث المبني على المحتوى 
استرجاع الصور المبني على المحتوى 
حقوق نشر الصورة 

تاريخ التحميل على الخط المباشر 
تاريخ إنشاء التسجيلة 

الويب العميقة 

عمق عمل الزاحف 

استرجاع الصور بتصفح المصطلحات 
روابط غير نشطة 

اسم نطاق الموقع 

البحث بحقول الوصف 

شكل ملف الصورة 


المصطلح الإنجليزي 
Address Bar‏ 
Animation‏ 
Assigned Indexing Terms‏ 
Bibliographic Description Card‏ 
Boolean Logic‏ 
Boolean Operators‏ 
Case Ssensitive‏ 
Concept-Based Searching‏ 
Content Based Image Retrieval‏ 
Copy Rights‏ 
Date Placed online‏ 
Date Record Created‏ 
Deep Web‏ 
Depth of Crawl‏ 
Direct Text Image Retrieval‏ 
Disconnected Links‏ 
Domain Name‏ 
Field Searching‏ 
File Shape‏ 
Folder Viewers‏ 


تصفح ملفات الصور 


مدى تكرار عملية الزحف 
نظم تصفح الصور الكاملة 
الصفحة الدليلية 

بروتوكول نقل النص الفائق 


Frequency of Crawl 
Full-Image-Management Systems 
Home page 

Hyper Text Transfer Protocol (http) 
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لفة ترميز النص الفائق 

تحليل محتوى الصور 

نظم إدارة الصور 

وسيط الصورة 

نظم استرجاع الصور الداخلية 
الويب الخفية 

محركات البحث المتعددة 


المواد المرئية المتحركة 
نظم تصفح الصور الخارجية 
نوع ملف الصورة 

البحث بالعبارات 

نظم التصفح المصورة 
البحث بتقارب الكلمات 
استرجاع الصور بالتماذج التصويرية 
المواد المرئية الثابتة 

النص المحيط بالصور 
ترميز الملفات الإلكترونية 
استرجاع الصور المبني على النص 
وسيط النص 

تصفح الصور بالمصطلحات 
بنية ملفات الصور 

الويب غير الشفافة 

الويب الخاصة 

الويب ذات الملكية 

اللقطات 

مصدر المعلومات الموحد 
التصفح المرئي 

متصفحات الويب 


صفحة الويب 


البحث الحر 
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Hypertext Markup Language (html) 
Image Content Analysis 
Image Management Systems 
Image Media 

Inside Pictorial Image Retrieval 
Invisible Web 

Meta Search Engines 

Meta Tags 

Metadata 

Mirror Sites 

Moving Visual Materials 
Outside Pictorial Image 
Photo Format 

Phrase Searching 

Pictorial Image Retrieval 
Proximity Searching 

Sketch Image Retrieval 

Still Visual Materials 
Surrounding Text 

Tagging 

Text Based Image Retrieval 
Text Media 

Textual Image Browsing 
Texture 

The Opaque Web 

The Private Web 

The Proprietary Web 
Thumbnail 

Union Resource Locator (URL) 
Visual Browsing 

Web Browsers 

Web page 

Wild card 


الملحق (Y)‏ 
أولا نماذج الوصف الفني للصور الرقمية 


Top Level Metadata Description for Complete Image 

Title: A selector and his family, probably in the Beenleigh district, 1872 
Creator: William Boag 

Subject: Photograph collection - Queensland 


Description: The difficulties faced by a family in the Queensland bush included poor 
roads, an unreliable mail service and dense, vine-matted scrub. For many years, a 
selector's staple diet was salted meat (salt horse) and pumpkins. For several 
months, a woman and her children might be alone in their stringy-bark hut while 
her husband went off to split shingles or to earn extra money on a cattle property. 


Date.created: 1872 

Date.recordCreated: 1996 

Date.placedOnline: 1997 

Publisher: State Library of Queensland 

Type: image.photograph 

Format: image/jpg 

Format.fileSize: 50.6Kb 

Format.dimensions: 672 x 512 

Format.colorpalette: grayscale 

Identifier: http://archive.dstc.edu.au/RDU/SLQ/boag/20248.jpg 
Source: BOAG negative no. 906 

Language: en 

Relation.isPartOf: http://www.slq.qld.gov.au/jol/boag.htm 
Relation.hasParts: Regioni 

Relation.hasFormat: http://archive.dstc.edu.au/RDU/SLQ/boag/20248.gif 
Coverage: Beenleigh region, Queensland, 1872 

Rights: http://www.slq.qld.gov.au/cright.htm 
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Secondary Level Metadata for 1 


Identifier: Regioni 

Title: Annie Dickson 

Description: Wife of James Dickson and mother to their 13 children. 
Coverage.rect: 495,207,546,263 

Relation.isPartOf: http://archive.dstc.edu.au/RDU/SLQ/boag/20248.j 
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الملحق (Y)‏ 
gales‏ الوصف الفني للصور التقليدية 


CREATOR 

Keenan's Gallery, 118 West Fourth St., Cincinnati, O. 
TITLE 

[Three-quarter portrait of Adjutant William Blackford Stephenson, 1840-1879] 
DESCRIPTION 

1 photoprint: albumen, 10 x 6 cm. (Carte de visite) 
SUBJECTS 

Military officers - Ohio 

Ohio Infantry, 53rd Regiment 

COLLECTION 

Higby Family Photograph Collection 

LOCATION 

P20/1/6 

COPYRIGHTS 


Copyrights have not been dedicated to the public. Consideration of the requirements 
of copyrights is the responsibility of the author and publisher. 


NOTES 
verso: "Camp Denison/March 7th, 1864/Adj Stephenson/53rd Reg com" 
CONTROL NO. 
CWIO1.txt 
99 
CREATOR 
unknown 
TITLE 
[Group portrait of 20 officers of the 82nd O.V.I., posing on steps of the Ohio State 
House] 
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DESCRIPTION 

Silver-gelatin print, 12 x 16 cm. 
SUBJECTS 

Ohio infantry, 82nd Regiment 

Military officers - Ohio 

COLLECTION 

F. & R. Lazarus Photographic Collection 
LOCATION 

P92/11/#213 

COPYRIGHTS 


Copyrights have not been dedicated to the public. Consideration of the requirements 
of copyrights is the responsibility of the author and publisher. 


NOTES 

verso: "82nd O.V.I." 
CONTROL NO. 
CWIO2.txt 


CREATOR 

Gurney & Son, Fifth Ave., N.Y. 

TITLE 

[Portrait of General George H. Thomas] 

DESCRIPTION 

Cabinet photograph ; 17 x 11 cm. 

SUBJECTS 

Military officers - Ohio - Generals - Military service 

Thomas, George Henry, 1816-1870 

COLLECTION 

John H. Klippart Family Collection 

LOCATION 

P157/1/3 

COPYRIGHTS 

Copyrights have not been dedicated to the public. Consideration of the requirements 
of copyrights is the responsibility of the author and publisher. 

NOTES 

verso: "Gen. Thomas' 
CONTROL NO. 
CWIO3.txt 
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الملحق )£( 
هيئات الصور الرقمية 


هيئة 13۸ 

يأتي هذا الاختصار للتعبير عن «The International Imaging Industry Association‏ 
وهي مؤسسة تعمل على دعم ملفات الصور الرقمية. بشكل غير هادف للربح.وتتكون 
هذه الهيئة من تكامل مجموعة كبيرة من الشركات حول العالم تعمل على وضع 
المعايير و مواصفات التعامل مع الصور. ويمكن القول أيضًا إن هذه الهيئة هي نتاج 
اندماج مجموعة من luigi!‏ مثل Digital Imaging Group (DIG) and the Photographic and‏ 
Imaging Manufacturers Association (PIMA).‏ وقد تواصل عملها لمدة Lele ٠١‏ في هذا 
لمجال. ثم حملت هذه الهيئة على عاتقها منذ ذلك التعامل مع المواصفات 
الملائمة لبناء صناعة التصوير والصور الرقمية. 
هيئة NISO‏ 

يعبر هذا الاختصار عن calag National Information Standards Organization‏ هذه 
الهيئة اعتمادًا على تفويض هيئة American National Standards Institute (ANSI).‏ تعمل 
هذه المؤسسة على إصدار معايير يمكنها التطبيق على البيئتين التقليدية والرفمية 
يمكن معها تلبية احتياجات المعلومات المختلفة ؛ بما في ذلك من عمليات 
الاسترجاع والحفظ والتخزين والميتاداتا.وقد بدأت هذه الهيئة منذ عام ۱۹۳۹م ثم 
تغيرت إلى هيئّة غير هادفة للربح في عام YAAY‏ تحمل الطابع التعليمي. ثم 
استقرت على اسمها الحالي) (NISO)‏ بعد ذلك بعام واحد. 
هيئة ههلا 

ينطوي هذا الاختصار على مفهوم Visual Resources Association‏ وقد بدأ الإعداد 
لهذه الهيئّة Ais‏ انعقاد اللقاء السنوي College Art Association conferences (CAA)‏ في 
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عام al AVA‏ ثم خرجت توصية لأعضاء اللقاء السنوي Art Libraries Society of 441g}‏ 
North America (ARLIS/NA).‏ المنعقد في عام ۷۰م على أن يتم البدء في تشكيل 
لجنة أو هيئة من الأعضاء للتعامل مع موضوعات إدارة وتنظيم المعلومات 
المصورة. وفي نهاية عقد السبعينات وبداية عام ۱۹۸۰م بدأت هيئتا (ARLIS/ (CAA)‏ 
NA)‏ العمل على وضع المراحل الأولى لإقامة هذه الهيئة معتمدة على مجموع ٠٠٠‏ 
عضو حول العالم. وعملت هذه الهيئّة بعد ذلك على إصدار نشرة خاصة بالهيئة 
تتناول منشورات المؤتمر السنوي بالإضافة إلى الاهتمام بموضوعات تنظيم وإدارة 
المواد المصورة مركزة على مواد الشرائح و الصور الفوتوغرافية. 
هيئة TASI‏ 

تعد هذه الهيئة eal‏ هيئات التعامل مع الصور الرقمية على الويب. ويشير 
اختصار الهيئة إلى مفهوم The Technical Advisory Service for Images‏ وقد cala‏ هذه 
الهيئة معتمدة على دعم هيئة Joint Information Systems Committee.‏ ©15لوتقدم هذه 
aig‏ خدماتها وإرشاداتها في مجال الصور الرقمية. فضلا عن الخدمات التعليمية 
في هذا المجال مع التركيز على بعض الموضوعات منها : 


” إنتاج الصور الرقمية. 

توصيل الصور الرفمية إلى مستخدميها. 

تطبيقات الصور الرقمية في محالات التعليم والتجارة والبحث العلمي. 
إدارة الكثير من المشروعات الخاصة peed‏ والصور الرفمية. 


NN S 


وتعمل هذه الهيئة على تحقيق مجموعة من الأهداف fie‏ : 
© دعم وتشجيع إنتاج واستخدام الصور الرقمية عالية الكثافة في مجالات 
البحث والتعليم. 
ترويج العمل باستخدام الصور الرقمية عن طريق إكسابها المواصفات 
الملائمة لذلك. 
oq‏ دعم كل ما يتعلق بالصور الرقمية سواء أكان الإرشاد al‏ الاستشارات 
al‏ التدريب al‏ المساندة. 
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هيئة Visual Arts Data Service‏ 
تتولى هذه الهيئة مهمة البحث العلمي الخاص بالمواد المصورة الرفقمية» فضلا 
عن دعم إنتاج هذه المواد ودعم خصائص الحفظ طويل المدى لها. وتعمل هذه 

الهيئة على تحقيق مجموعة من الأهداف منها ما يلي :- 

o‏ دعم إنتاج وتجهيز المواد المصورة الرقمية للبحث والاستخدام على شبكة 
الويب. 

o‏ دعم حفظ المواد الرقمية المصورة للتأكيد على المدى الممتد لاستخدامها. 

0 العمل على ترويج وممارسة Joll‏ مع المواد المصورة الرقمية. 

وتقدم هذه الهيئة LE!‏ مجموعة من الخدمات مثل : 

5 خدمة الوصول إلى المواد المصورة الرقمية. 
حفظ مجموعات المواد المصورة الرقمية لفترة تتيح استخدام ممتد لهذه 
المواد. 

ع تقدم خدمة التواصل العلمي والمشروعات العلمية في قطاعات دراسة المواد 
المصورة الرقمية. 
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الملحق (e)‏ 
واجهات محركات بحث cuc‏ الدراسة 


يشمل هذا الملحق على الترتيب ما يلي :- 


.١ 


.Y 


F 


البحث باليات المنطق البولينى فى محركات Altavista, Google.‏ 
ai‏ البحث بحساسية الحروف لمحرك البحث Altavista.‏ 
البحث بآليات اللغة العربية داخل محركات البحث Google, Alltheweb.‏ 
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EX altavista’ Web Images MP3/Audio Video News 


Egypt not pyramids pa A| 


Find: [M] Photos ([v]Graphics [_]Buttons/Banners 


Color: All Colors Sources: All Sources Sizes: All Sources 
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c2 altavista Web Images MP3/Audio Video News 


Egypt not pyramids [  Find- A 


Find: ([v]Photos ([v]Graphics [ ]Buttons/Banners 


Color: All Colors Sources: All Sources Sizes: All Sources 
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altavista Web images MP3/Audio Video News‏ تلح 


Find: [¥/Photos (v]Graphics [_]Buttons/Banners 


Color: All Colors Sources: All Sources Sizes: All Sources 


Yva 


advanced search :: customize preferences :: submit site :: help 


alli(neweo = es 


finditall O oe‏ © هه 


| Web | News | Pictures | Video | Audio | 
1 - 12 of 8,238 Results for القمر‎ Offensive content filter: On - Off 


ويب صور مجموعات الدليل 


UNS 4. Google 


بحث عن الصور حا التفضيلات 


صور النتائج ٠٠١-١١‏ من حوالي ٠٠٠٠١‏ ل طائرة (الوقت المستغرق ^ «Y‏ *( 
عرض: كل الأحجام - كبير - متوسط - صغير 


—Ó— 


—Y'£4 — 


ال 


شكلت الصور الرقمية في بيئة الويب واحدة من أهم وسائط حمل المعلومات الرقمية. 
وتنوعت المعلومات 3,51 داخل الصور عامة رالا ا د Spo QURE‏ 
العلمية والصور الفنية العامة. وقد أخذت أعداد ملفات الصوز الرقمية في تزايد مستمر إلى 
أن شكلت Les‏ هائلاً من مصادر المعلومات الرقمية المرئية التي تحتاج إلى معالجة فنية 
وتنظيم واسترجاع old‏ طبيعة خاصة. غير أن الويب لم تقدم المعايير الملائمة للمعالجة 
الفنية أو التنظيم للصور الرقمية: كما أن أدوات تنظيم وبحث الصور الرقمية (محركات بحث 
الصور) لم تستطع تقديم الآليات الملائمة للتعامل مع وسيط الصورة بوصفه مصدر معلومات 
رقميًاً. سواء كان ذلك في المعالجة والتنظيم أم البحث والاستدعاء لملفات الصور الرقمية. 
عمل هذا deni‏ على dsl‏ ا Reg‏ إلى ا اللا mu‏ ا 
الصور الرقمية ALL‏ إلى جانب دراسة خصائص الصورة الرقمية الثابتة بوصفها 
وسيطاً لحمل المعلومات المرئية؛ من حيث عناصرها الخارجية الشكلية أو الداخلية 
الموضوعية: بالإضافة إلى دراسة آليات عمل محركات بحث الصور الثابتة وخصائص 
المعالجة الفنية والتنظيم داخلها. 

كما اهتم البحث بصياغة مواصفات مخركات بحث الصور الثابتة Ley‏ يحاكي ويلائم 
خصائص اللفة العربية باعتبارها إحدى لغات البحث والاسترجاع للمضادر الرقمية في 
io‏ الويب. | 

انتهى البحث إلى وضع نموذج لملامح عمل محركات بحث الضور الرقمية Ley‏ يدعم 
المعالجة والتنظيم والاستدعاء وفقاً لطبيعة اللغة العربية. 
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